基于长短期记忆网络的驾驶意图识别方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

LSTM 网络核心结构如图 1 所示。
个社会等级,并由 GWO 算法建立了一个模型,该算法通
过比较得到各个灰狼的社会等级来控制检索方向,相比
于其他群体智能算法,该优化算法通过引入可变的收敛
因子以及及时的信息反馈机制,可实现自我调节,进而
可以更好地提高算法的优化效率。使用 GWO 在 LSTM
模型的参数寻优中,当寻优范围设置得当时,会使模型
[1]
特征参数的基于支持向量机驾驶员超车辨识模型;Song
等[8]利用驱动模型对贝叶斯网络进行校准和执行,提出
为典型代表,使用隐马尔科夫理论(Hidden Markov Meth⁃
一种新型驾驶员模型与贝叶斯网络结合的机动变道算
究成果,主要内容是利用 HMM 模型从感观数据中识别
识别、翻译等领域取得一系列重大突破,有研究者开始
[6]
t−1
(2)
ℎ t − 1 为 t-1
w 0 为输出门的权重;
式中,o t 为输出门的输出;
时刻的隐藏状态;ℎ t 为 t 时刻的隐藏状态;x t 为输入数
据;b 0 为备选细胞状态的偏差。
31 长短期记忆网络
LSTM 模型利用细胞内的自循环来实现固定参数下
尺度上的动态变化。汽车驾驶行为数据隐藏着与车辆
司机的注意力也在被这些装置不断分散,继而使汽车在
量机、贝叶斯网络等,例如曲代丽[4]以制动踏板开度及
行驶过程中的风险大大增加,因此,人们正在致力于自
其变化率、制动减速度作为参数,给出一种基于模糊神
动 化 驾 驶 辅 助 系 统 的 研 究 ,如 使 用 驾 驶 员 辅 助 系 统
经网络的驾驶意图识别方法;王庆年等[5]将驾驶意图分
的准确性,基于数据集训练并评估模型,结果表明:所提方法对加速和制动意图识别的准确率、召回率
和 F lmacro 分数分别为 0981、0983 和 0982,均优于支持向量机 (SVM) 和普通的 LSTM 模型。
关键词:驾驶意图识别;长短期记忆网络;灰狼优化算法
中图分类号:U471
收稿日期:2023-03-08
er ,GWO)来优化模型的网络超参数,达到长短期记忆网
络参数寻优范围的自整定。对比分析不同模型的分类
效果,最终证实本文所提出的 GWO-LSTM 模型可获得
最优辨识结果。
2 驾驶员驾驶意图分析
在日常驾驶过程中,司机的驾驶意图会受到由自车
情况、路面条件和司机自身组成的人-车-路系统内信息
LSTM 网络核心结构图是由若干个上图中的细胞结
真实为正类
TP
TN
短期记忆网络特有的擅于分析时序数据的特性,并通过
真实为负类
FP
FN
GWO 优化方法确定网络最优参数,确保该模型能够收
敛于全局最优。图 3 为 GWO 算法优化 LSTM 网络的流
程图。
· 16 ·
我们从混淆矩阵中可以得出分析指标:
制动、一般制动、紧急制动 6 个驾驶意图。在此基础上,
采用灰狼优化算法对网络参数进行优化。
交叉熵损失
P(缓慢加速)
P(一般加速)
P(急加速)
P(缓慢制动)
P(一般制动)
P(紧急制动)
Softmax层
初始状态
LSTM cell
LSTM cell
Xt-1
Xt
...
LSTM cell
Xn
自身特征
图 2 基于 LSTM 的驾驶意图识别网络结构
矢量;X (iter + 1) 是最终位置;r 2∈[0,1];a 为收敛因子,
计算公式为 a = 2 − (l/l max ),l 为迭代次数,l max 为最大迭
代次数。我们可以发现,当迭代次数增加时,a 的值会呈
现出一种线性下降的趋势,最终降至 0。
4 构建基于 GWO-LSTM 驾驶意图识别模型
在接收到司机驾驶行为信息的同时,对于司机驾驶意图
的驾驶意图模型;麻婷婷等[7]提出一种以方向盘转角、
的正确辨识是 ADAS 至关重要的一点。
车辆速度、车辆与道路边界的距离和驾驶人眼部信息为
目前,国内外学者在驾驶意图的识别方面已经积累
了一定经验,以 Pentland,Mizushima,Meyer-Delius 等
如果采用太多的特征参数会增加模型训练难度、影响模
型的预测准确性。在正常情况下,踏板开度大小可以反
映司机驾驶意图,但不能表示司机加速意图和制动意图
的紧急迫切程度,因此,我们不能够单纯地仅仅通过踏
板开度这一数据来实现精确的加速和制动需求。
为了能够得到更精确的驾驶意图模型,本文选取加
速踏板开度 a、制动踏板开度 b 和其踏板对应的开度变
构组成,每个细胞结构中有 3 个控制门:遗忘门、输入
门、输出门。
遗忘门(forget gate)控制是否遗忘,公式为:
( [
]
f t = σ w f ℎ t − 1,x t + b f
)
(1)
式中,σ 为 sigmoid 函数;w f 为遗忘门权重;ℎ t − 1 为 t-1 时
刻的隐藏状态;x t 为输入数据;b f 为遗忘门的偏差。
(ADAS)的 车 道 保 持 系 统(LKS)和 自 适 应 巡 航 系 统
为动力模式和经济模式,提出了基于模糊神经网络的驾
(ACC)。但是,在不知道司机驾驶意图的情况下,这些
驶意图识别模型;李慧等[6]通过采集分析自车加速踏板
辅助系统和设备极容易误导司机的驾驶策,所以系统
及其变化率,提出一种采用粒子群优化支持向量机参数
32 灰狼优化算法
灰狼优化算法(Grey Wolf Optimizer)是一项模拟灰
驾驶行为有关的具备时间延续性的内容,为了能达到良
狼的社会等级制度和捕食行为而提出的全新集群智能
好的仿真结果,因此使用 LSTM 模型对意图识别建模。
优化算法[12]。在灰狼族群中一共存在 α、β、δ 和 w 共 4
od,HMM)对驾驶意图展开研究并得出了一些有益的研
法对驾驶意图进行识别。随着长短期记忆网络在语音
驾驶人行为,之后该模型可以通过汽车驾驶人最初的准
将 其 用 在 驾 驶 意 图 识 别 方 向 ,以 季 学 武(LSTM)等 团
备动作中预测他们的后续动作;马晶晶[2]以实际交通环
队[9-11]为代表,使用长短期记忆(LSTM)网络对驾驶员的
3 模型结构
t
c
(3)
式中,tanh 为 tanh 函数;w i 为输入门权重;w c 为即将更
新到细胞状态中的备选细胞状态的信息;ℎ t − 1 为 t-1 时
刻的隐藏状态;x t 为输入数据;b i 为遗忘门的偏差;b c 为
备选细胞状态偏差。则 LSTM 细胞状态的更新过程为:
ct = ft × ct − 1 + it × at
DOI:1019999/jcnki1004-0226202307005
于驾驶员驾驶意图辨识的双层 HMM 模型。而根据模
1 前言
随着汽车行业的不断发展,各种汽车电子装置、定
式识别理论,研究者可以将意图识别问题转变为特定的
位装置、手机以及其他远程信息处理装置的日益普及,
意图类型问题,这一类型的方法又有神经网络、支持向
确度的一个基准规格,用 n 行 n 列的矩阵形式表示。混
解的不足,而灰狼优化算法则拥有全局收敛且收敛速度
淆矩阵如表 1 所示。
较高的特性。本文主要将 GWO 应用于 LSTM 的参数优
化,同时将采用基于 GWO 的 LSTM 时间序列数据分类
表 1 混淆矩阵
预测为正类
预测为负类
预测模型应用于驾驶意图辨识方向。该模型吸取了长
短期记忆 (Long Short-term Memory,LSTM) 网络的驾驶意图识别方法,能够较为准确地识别目标车辆
的驾驶意图。该方法将踏板开度和踏板开度变化率输入意图识别网络,并在意图识别网络中引入灰狼优
化算法 (Grey Wolf Optimizer,GWO) 对网络参数进行优化,提高驾驶意图识别性能。为了验证该方法
41 LSTM 驾驶意图识别网络结构
如图 2 所示,本文采用 LSTM 网络结构来构建驾驶
意图识别模型。被预测车辆自身特征的嵌入维度为 4,
分别为加速踏板开度 a 和其开度变化率 da/dt 以及制动
踏板开度 b 和其开度变化率 db/dt,LSTM 网络的隐藏维
度为 6,它们分别为:缓慢加速、一般加速、急加速、缓慢
灰狼靠拢,位置迭代公式如下:
{
X 1' = X α − A 1 P α
X 2' = X β − A 2 P β
X 3' = X δ − A 3 P δ
(11)
A k = 2ar 2 − a,k = 1,2,3
X ( iter + 1 ) =
(12)
X 1' + X 2' + X 3'
3
(13)
式中,X 1′、X 2′、X 3′ 分别是灰狼 X i 要向 α、β、δ 方向移动的
:广西科技计划项目 (桂科 AA22068060);柳州市科技计划项目 (2021AAA0104,2022AAA0102);柳东科技计划项目 (20210117)
· 14 ·
Copyright©博看网. All Rights Reserved.
底盘设计
意图辨识方法,并且通过灰狼算法(Grey Wolf Optimiz⁃
境参数和汽车运行参数作为输入,提出了一种伪二维隐
换道意图进行识别,并且发现将意图识别考虑在内的轨
[3]
马尔科夫(P2D-CHMM)驾驶意图辨识模型;王畅 则以
实时在线辨识复合工况下的驾驶意图为目标,建立了用
迹预测模型能显著提高轨迹预测精度。
本文提出一种基于长短期记忆网络(LSTM)的驾驶
基金项目:
基金项目
具有更快的寻优速度和较高的分类准确率。
假设搜索空间是 P 维的,每只狼的位置是 1 个矢量
X i = ( X i,1,X i,2,…X i,P ),那么狼群 X 由 N 只灰狼组成 X =
{ X 1,X 2,…X N }。灰狼 X i 在更新位置时,首先要计算自己
与最好的 3 只狼的距离,计算公式如下:
42 基于灰狼优化算法的 LSTM 驾驶意图识别模型
一般的 LSTM 参数的确定和优化是利用时序反向
传 播(Back Propagation Through Time,BPTT)算 法 实 现
43 模型评价指标
431 混淆矩阵
混淆矩阵又被称之为误差矩阵,是用来评价模型准
的,但是该算法存在统计复杂性较大、可能收敛于局部
(9)
C k = 2r 1,k = 1,2,3
(10)
式中,P α、P β、P δ 分别代表灰狼 X i 距离灰狼 α、β、δ 的位
置;X i ( t ) 为当前灰狼位置;C 1、C 2、C 3 是随机向量;r 1∈[0,
1]的随机数。
求出 X i 距 α、β、δ 3 只灰狼的距离后,X i 要向这 3 只
2023 年第 07 期
总第 314 期
基于长短期记忆网络的驾驶意图识别方法
席婵婵 1
杨昌波 2
李 骏2
郑伟光 3
1. 桂林电子科技大学机电工程学院,广西桂林,541004
2. 东风柳州汽车有限公司,广西柳州,545006
3. 广西科技大学机械与汽车工程学院,广西柳州,545006
摘要:为了使高级驾驶员辅助系统能够更好的工作,进而提高其安全性和舒适性,提出一种基于长
化率 da/dt、db/dt 这 4 个参数作为意图识别模型的输入
量,利用智能算法对踏板数据进行解析,并据加速、制动
] )
( [
= tanh ( w . [ ℎ ,x ] + b )
i t = σ w i . ℎ t − 1,x t + b i
at
c
速 、缓慢制动、一般制动、紧急制动 6 种驾驶意图。
输入门(input gate)决定何种信息被更新到细胞状
的影响。比如自车速度、加速度、加速踏板开度、方向盘
态中,主要由两部分组成,一部分输出是 it,另一部分输
转角等自车数据;路面摩擦阻力因数、自车至路面边界
出是 at。公式为:
的距离等路面环境信息;以及司机自身的一些信息,这
些都可以作为判断驾驶员驾驶意图的特征参数,不过,
图 1 LSTM 网络核心结构图
Copyright©博看网. All Rights Reserved.
P α = C 1 X α − X i (t)
(7)
· 15 ·
2023 年第 07 期
总第 314 期
P β = C 2 X β − X i (t)
(8)
P δ = C 3 X δ − X i (t)
(4)
输出门(output gate)对信息进行选择性输出,并且
在细胞状态参与下进行输出,数学表达式为:
( [
)
(5)
( )
(6)
]
o t = σ w 0 ℎ t − 1,x t + b 0
ℎ t = o t × tan ℎ c t
意 图 的 快 慢 程 度 将 其 分 为 缓 慢 加 速 、一 般 加 速 、急 加
相关文档
最新文档