一种基于深度强化学习的防碰撞控制方法[发明专利]
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专利名称:一种基于深度强化学习的防碰撞控制方法
专利类型:发明专利
发明人:谢国涛,王静雅,胡满江,秦晓辉,王晓伟,徐彪,秦兆博,孙宁,钟志华
申请号:CN201910283506.0
申请日:20190410
公开号:CN110027553A
公开日:
20190719
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于深度强化学习的防碰撞控制方法,采用深度确定性策略梯度方法(DDPG算法)进行深度强化学习,该方法包括:步骤1,提取本车参数和环境车辆参数;步骤2,利用本车参数和环境车辆参数,构建虚拟环境模型;步骤3,根据本车参数和环境车辆参数和虚拟环境模型,定义所述深度确定性策略梯度方法的基础参数;步骤4,根据步骤3定义好的基础参数,采用深度强化学习中的神经网络构建防碰撞控制决策系统,所述防碰撞控制决策系统包括策略网络和评价网络;步骤5,训练所述策略网络和评价网络,得到所述防碰撞控制决策系统。
本发明通过构建基于深度神经网络的防碰撞控制决策系统,基于时间差分强化学习方法不断优化网络控制结果的防碰撞控制决策系统,有效提高了防碰撞控制决策系统的控制性能。
申请人:湖南大学
地址:410082 湖南省长沙市岳麓区麓山南路麓山门
国籍:CN
代理机构:北京汇智胜知识产权代理事务所(普通合伙)
代理人:石辉
更多信息请下载全文后查看。