• 简体   /   繁体
基于PPO算法的自动驾驶人机交互式强化学习方法-计算机应用研究2024年09期

基于PPO算法的自动驾驶人机交互式强化学习方法

作者:时高松 赵清海 董鑫 贺家豪 刘佳源 字体:      

摘 要:针对当前自动驾驶领域中深度强化学习(deep reinforcement learning,DRL)所面临的高计算性能需求和收敛速度慢的问题,将变分自编码器(variational autoencoder,VAE)和近端策略优化算法(proximal policy(试读)...

计算机应用研究

2024年第09期