基于周期分割的睡眠自动分期研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于周期分割的睡眠自动分期研究
李同庆;邹俊忠;张见;王蓓;卫作臣
【摘要】为实现高效的自动睡眠分期,提出一种基于周期分割的时域信号处理方法,采用合并增减序列方法对三个通道多导睡眠图记录(2路脑电,1路眼电)进行周期分割,根据信号波形的周期标记睡眠各期的特征波形,提取特征波形在每一帧数据的时长占比与平均幅值作为特征.双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)作为分类器,解决传统机器学习方法无法利用睡眠数据时间上下文信息的缺点.对42699个样本使用交叉验证方法得到了84.8%的平均准确率,实验结果表明合并增减序列方法可以降低脑电信号分析的复杂度,是一种有效的时域信号处理方法,双向长短时记忆网络可以有效提高睡眠分期准确率,具有良好的应用前景.
【期刊名称】《计算机工程与应用》
【年(卷),期】2019(055)009
【总页数】6页(P94-99)
【关键词】睡眠分期;周期分割;合并增减序列;深度学习;双向长短时记忆网络
【作者】李同庆;邹俊忠;张见;王蓓;卫作臣
【作者单位】华东理工大学信息科学与工程学院自动化系,上海 200237;华东理工大学信息科学与工程学院自动化系,上海 200237;华东理工大学信息科学与工程学院自动化系,上海 200237;华东理工大学信息科学与工程学院自动化系,上海200237;华东理工大学信息科学与工程学院自动化系,上海 200237
【正文语种】中文
【中图分类】R318
1 引言
睡眠是人体重要的生理活动,人有1/3的时间在睡眠中度过,睡眠可以使人缓解
疲劳,恢复人体精力。

在现代社会,随着生活与工作节奏加快,越来越多的人睡眠质量下降,甚至存在睡眠障碍等疾病,不仅严重损害了患者身体健康,同时也影响了患者的工作与生活。

睡眠分期对于帮助人们进行睡眠质量评估和诊断睡眠相关疾病具有重要意义,美国睡眠医学会(American Academy of Sleep Medicine,AASM)在2007年制定的新的睡眠分期准则将R&K睡眠分期准则中的N3期和
N4期合并为慢波睡眠期,将睡眠状态分为5期:觉醒期(W)、非快速眼动期(N1)、非快速眼动二期(N2)、非快速眼动三期(N3)、快速眼动期(REM)[1],并将睡眠数据每30 s划分为一帧数据进行分期,不同的睡眠阶段在整晚的睡眠中具有不同的时间和频率模式,时长占比也具有很大差异[2]。

传统的睡眠分期方法主要由睡眠专家根据多导睡眠仪记录的睡眠数据进行视觉分析完成,该方法准确率较高但是效率低下而且质量容易受到专家个人经验水平影响。

自动睡眠分期方法的研究已成为睡眠医学领域的研究重点[3],已经有很多国内外
学者对其进行了研究,张泾周[4]等使用脑电、眼电、肌电的17个分类参数作为特征并使用BP神经网络作为分类器,得到了79%的准确率。

李谷[5]等使用希尔伯
特黄变换提取脑电信号不同频段的能量特征,使用最近邻分类器,得到了81.7%
的准确率。

Fraiwan[6]等使用小波变换提取脑电信号的Renyi熵作为特征,使用
随机森林分类器得到了83%的准确率。

傅里叶变换、小波变换和希尔伯特黄变换
等现在数字信号处理方法,将原始的时域信号变换到其他域,丢失了睡眠分期所依
据的脑电信号的特征波形信息,而时域信号处理方法是一种直接的脑电信号处理方法,更接近睡眠专家的视觉分析结果,具有显著的优势。

本文使用一种新的基于周期分割的时域脑电信号处理方法,该方法使用合并增减序列方法自动分割睡眠脑电信号周期,标记α波、β波、θ波、δ波、纺锤波等睡眠脑电特征波形,提取特征波形在每一帧数据的时长占比与平均幅值作为特征。

近年来深度学习算法已成为人工智能领域的重点研究方法,相对于传统的机器学习方法,其通过构建多个隐含层,对数据进行多层非线性特征变换,得到更高层的特征表示,从而学习到数据更本质的规律,具有良好的泛化性能。

LSTM(Long Short Term Memory network)[7]神经网络是一种重要的深度学习算法,其解决了传统递归神经网络在长时依赖时的梯度消失问题,在语音识别[8]、机器翻译[9]、手写识别[10]等一系列需要长期依赖的问题上取得了很大进展。

人体的睡眠状态连续变化的,睡眠分期是一个时间序列问题,LSTM神经网络的主要优势是可以学习睡眠专家在标注睡眠数据输入序列时需要的长期依赖信息和不同睡眠阶段的转换规则[11]。

由于LSTM神经网络只能利用时间上文信息,本文选择LSTM神经网络的扩展,双向LSTM[12]神经网络作为分类器,双向LSTM神经网络在两个方向上对输入序列进行操作,同时利用睡眠数据样本的时间上下文信息从而得到更高的睡眠分期准确率。

2 模型和方法
2.1 实验数据
本文使用的睡眠数据来源于MIT-BIH中的Sleep-EDF数据库,该数据库采集了20位成年无睡眠障碍的受试者的睡眠记录,其中一个受试者采集了1天的睡眠记录,其余19位受试者每人采集了2天的记录,共39份记录。

所有睡眠数据按照30 s一帧进行划分并由专家按照R&K睡眠分期准则标注。

在本实验中将N3期和N4期合并为N3期。

为了能够更合理地评估分类方法性能,对每个每天受试者记
录只保留睡眠时间前后共550 min的数据。

本文使用20个受试者的39份记录来训练与评估模型,一共包含42 699个样本,使用20折交叉验证方法来评估模型
的泛化性能,在每一折中使用一个受试者的样本作为测试集,其余19个受试者的样本作为训练集。

所有样中W期样本11 760个,占比27.6%,N1期样本2 280个,占比5.3%,N2期样本16 132个,占比37.8%,N3期样本5 296个,占比12.4%,REM期样本7 231个,占比16.9%。

2.2 周期分割算法
脑电信号的周期分割主要使用合并增减序列方法,定义为第i个采样点,在序列中,如果x>i xi+k,k=1,2,…,n,xi+k≤xi+k+1,k=1,2,…,n-1,xi+n>则为递增序列,x为一个局部极大值i+n点,xi+1为一个局部极小值点。

同样如果
xi+n+l≥x,l=1,2,…,m-1,x<x则{i+n+l+1i+n+mi+n+m+1为递减序列。

xi+n+m是一个局部极小值点。

使用一个新的序列xai记录局部极大值点和极小值点,ai=i+1,ai+1=i+n,ai+2=xi+n+m[13]。

增减序列分合并规则主要来自于
视觉组织原则。

视觉组织原则主要指量化格式塔原则[14]将基本的图像元素构成一个主体的方法[15]。

对于波形周期分割来说,视觉显著点只可能是增减序列的局部极大值和极小值,合并规则根据增减序列的极大值和极小值的分布特征进行聚类,完成波形合并[13]。

合并增减序列算法主要包括两部分:合并杂波和合并不完整波。

2.2.1 合并杂波
图1 增减序列合并算法
图2 合并规则
脑电信号具有信号微弱,背景噪声强的特点[16],将幅值小于10 μV周期小于20 ms的波视为杂波[17-18]。

合并杂波可以将睡眠脑电信号的噪声滤除,使波形的
周期划分更加精准。

本文实验使用的睡眠数据的采样频率为100 Hz,最小的波形周期为20 ms,因此仅将幅值小于10 μV的波合并。

合并过程如下:如上文所示
xai为一个局部极小值,令 f1=xai+1-xai,f2=xai+1-xai+2,fmax=max(f1,f2)其中 f1代表递增幅值,f2代表递减幅值,当fmax<10μV时,波形
xai,xai+1,xai+2是杂波,删掉 xai+1,xai+2,重新计算增减序列,设
xt=max(xai+1,xai+3),令ai+1=t,ai+2=ai+4,ai+3=ai+4得到新的序列,依次合并整个序列,增减序列合并算法如图1所示。

2.2.2 合并不完整波
完整波与不完整波的定义由Zhang提出[19],设 f1=xai+1-xai,f2=xai+1-
xai+2,f3=xai+3-xai+2,f4=xai+3-xai+4,定义合并阈值th,其范围在0~1之间,如果满足下面一条或者多条条件,则进行合并,合并规则如图2[13]所示。

(1)f1/f2<th,f3/f4<th
(2)f2/f1<th,f4/f3<th
(3)f2/f1<th,f3/f4<th
(4)f2/f1<th,f3/f4≥th,f4/f3≥th,f2/f3≤th
(5)f3/f4<th,f1/f2≥th,f2/f1>th,f2/f3>th
从以上的公式中可以看出,合并阈值th直接影响合并结果,合并阈值th取不同值时分类算法的正确率如表1所示。

从表1中可以看出th取0.5时模型的泛化性能最好,因此在本文的实验中th选择0.5。

表1 合并阈值th取不同值时的模型正确率0.3 0.4 0.5 0.6 0.7 83.5 83.9 84.8 84.7 84.7
2.3 特征提取
睡眠脑电信号根据频率可以划分为不同的节律波,主要有α 波(8~13 Hz)、β 波(13~30 Hz)、θ 波(4~8 Hz)、δ 波(0.5~3 Hz)、纺锤波(12~14 Hz)、K复合波(0.5~1 Hz)等,不同睡眠期阶段会出现不同的特征波形[20]。

AASM分期标准与相应特征波形对应关系如表2所示。

从表中可以看出,睡眠阶
段的划分主要通过不同频率的特征波形的时长占比与幅值决定。

通过合并增减序列方法对睡眠脑电信号进行预处理,可以使脑电信号波形时域特征更明显。

如图3
所示为一段睡眠脑电信号的合并结果,蓝色为原始睡眠脑电信号,红色为合并之后的波形。

根据波形的周期和幅值,将其标记为不同的特征波形,并计算不同特征波形出现时长占比和平均幅值作为特征。

REM期主要特征波形为眼电通道的快速眼
动信号和2~7 Hz的低压混合频率波形,仅从脑电波形上与N1期不易区分,为
提高睡眠分期准确率引入眼电通道数据,分别从两路脑电和一路眼电信号提取如表3所示特征。

表 2不同睡眠阶段的特征波形和AASM分期标准W N1 N2 N3 REM α波、β波
α波、θ波纺锤波、K复合波δ波α波、β波、θ波α波>50%α波<50%,慢速
眼动出现纺锤波和K复合波0.5~2 Hz高幅δ 波>20%快速眼动,2~7 Hz低压
混合频率
图3 睡眠脑电信号合并结果
表3 从睡眠数据中提取的特征F1~F4 F5 F6 F7 F8~F11 F12 F13 F14 δ波、α波、θ波、纺锤波时长占比0.5~2 Hz高幅δ波时长占比1β波(13~18 Hz)时长占比2β波(18~30 Hz)时长占比δ波、α波、θ波、纺锤波、平均幅值
0.5~2 Hz高幅δ波平均幅值1β波(13~18 Hz)平均幅值2β波(18~30 Hz)平均幅值
2.4 双向LSTM神经网络
LSTM神经网络可以看做是每层共享参数的,沿着时间线展开的深度前馈网络[21],通过在不同时间步上共享参数,降低了模型复杂度,提高了模型的泛化能力,与深度前馈神经网络相比,其具有学习长期依赖信息的能力。

LSTM神经网络相对于传统递归神经网络的独特结构是使用一个记忆单元来代替递归神经网络中的隐含层节点,每一层由一组循环连接的记忆单元组成,每个记忆单元由记忆细胞(memory
cell)、输入门、遗忘门、输出门构成。

LSTM引入自适应门控机制,通过门控单
元来决定信息的取舍,记忆细胞通过一个固定权重为1的自连接循环边,确保梯
度可以通过许多时间步从而克服递归神经网络在训练时的梯度消失问题[22]。

每个LSTM记忆单元结构如图4所示,记忆单元的状态更新由下面等式决定:
xt表示当前t时刻输入,σ是sigmoid函数,Wf,Wi,Wo,Wc为对应结构的权重
矩阵,bf,bi,bo,bc为对应权重的偏置向量。

ft,it,ot分别是遗忘门、输入门和
输出门,输出值范围在0~1之间,0代表完全丢弃信息,1代表信息完全通过。

Ct是记忆细胞的状态,通过遗忘门控制上一时刻状态的遗忘程度,通过输入门控
制新信息的流入从而更新记忆细胞的状态。

ht是t时刻记忆细胞的输通过tanh函数对当前时刻的记忆细胞状态进行非线性变换,由输出门控制记忆单元信息输出。

图 4 LSTM记忆单元结构
双向LSTM神经网络通过两个LSTM在两个方向处理输入数据,从t=1到n迭代的计算前向前向隐含层序列,从 t=n ~1迭代计算后向隐含层序列,双向LSTM
神经网络的隐含状态,两个LSTM神经网络隐含层与同一个输出层连接,从而使
模型的输出能够同时利用序列中关于过去与未来的信息。

本文使用两层的深度双向LSTM神经网络结构,时间步长度为5,其结构如图5所示。

深度LSTM神经网络通过堆叠多层LSTM层构建,每一个后续层接收上一层的隐含状态作为时间序列
输入,在网络更新时,信息沿着层次结构传递,并在每层添加时间上下文信息。

每个时刻的输入序列在输出前经历了多层非线性变换可以使深度LSTM神经网络对
输入在不同时间尺度上进行学习[24]。

图5 两层双向LSTM神经网络结构
深度双向LSTM神经网络相对于传统机器学习方法模型复杂度高,很容易过拟合。

本文主要采用Dropout方法[25]和L2正则两种正则化方法来缓解过拟合问题。

Dropout方法是深度神经网络防止过拟合最有效的正则化方法之一,是一种参数
共享的Bagging集成算法。

通常应用在神经网络的全连接层和卷积神经网络卷积
层间,对于LSTM神经网络,Dropout方法并不应用在循环连接层的时间步之间,以免影响长期信息在LSTM神经网络中的传递,仅应用于同一时刻不同层之间记
忆细胞的信息传递[10]。

Dropout方法在神经网络训练过程每次依概率随机选择
部分神经元将其丢弃,仅更新保留的子网络的神经元参数。

从而使得模型参数更新不再依赖固定关系的隐含节点共同作用,有效缓解了模型对于局部特征的过拟合[26]。

本文选择带L2正则的Softmax回归作为模型的输出层,通过Softmax回
归可以得到样本属于每个类别的概率,L2正则化方法在损失函数上增加了对权重
的L2范数惩罚项,压缩模型的回归系数降低模型的复杂度。

3 实验结果与讨论
3.1 模型训练参数
本文实验中的双向LSTM神经网络每个隐含层隐含节点个数设为100,Dropout
正则化参数选择0.5,L2范数系数为0.001。

因为睡眠分期是一个多分类问题,因此模型损失函数选择交叉熵损失函数。

使用基于小批量随机梯度下降的Adam (Adaptive Moment Estimation)优化算法优化模型损失函数,其是一种启发式优化算法,可以对模型不同参数自适应调整学习率,对于稀疏特征以较大的学习率更新参数,对于非稀疏特征以较小的学习率更新参数,可以较好地避免因为睡眠各期数据不平衡造成的模型偏倚,将Adam优化算法的学习率设为0.000 1。

3.2 模型分类结果
本文使用合并增减序列方法对睡眠数据进行预处理,合并不完整波的合并阈值选择0.5,此时双向LSTM神经网络分类器在实验数据上使用20折交叉验证结果与人
工专家分期结果对比如表4所示。

表4 睡眠各期准确率W N1 N2 N3 REM 11 060 457 211 39 265 402 975 419
0 445 120 424 13 773 651 628 24 19 1 037 4 605 87 154 405 692 1 5 80694.0 42.7 85.1 86.9 80.3
从表4中的结果可见,本文所设计的双向LSTM神经网络分类器的泛化性能较好,平均准确率达到了84.8%,优于许多同类研究[4-6]。

准确率最低的是N1期,N1是觉醒期与其他睡眠阶段的过渡期,持续时间在1~7 min左右,睡眠状态不稳定,样本数量较少,在脑电波形上与REM期较难区分,主要误判为N2期与REM期。

觉醒期准确率最高,主要被误判为N1期,觉醒期与N1期特征波形均为α波,因为睡眠状态是逐渐变化的,睡眠信号波形在过渡阶段比较接近,不易区分造成误判。

N2期因为其特征波形睡眠纺锤波与K复合波的波形比较复杂,仅仅根据波形周期不能有效与其他特征波形进行区分,造成N2期的误判分布最广。

N3期准确率较高,在N3期人体处于深睡眠状态,睡眠状态比较稳定,该阶段特征波形δ波幅
值与周期特征比较明显,主要被误判为N2期。

为了能够更好地评估双向LSTM神经网络分类器的性能,选择另外两种睡眠分期
研究中两种具有代表性的分类器支持向量机、随机森林与双向LSTM神经网络分
类结果进行对比。

结果如表5所示,从表中可以看出双向LSTM分类器相对于随
机森林与支持向量机的结果均有不同程度的提升。

实验结果表明双向LSTM神经
网络可以充分利用睡眠数据的时间上下文信息,提高睡眠分期的准确率。

表5 不同分类器的结果双向LSTM随机森林支持向量机84.8 80.9 76.9
4 结束语
本文出了一种基于周期分割和双向LSTM神经网络分类器的睡眠分期方法。

通过
合并增减序列方法对睡眠脑电波形进行周期分割,该方法是基于视觉组织原则的,它通过合并不完整波达到分离单个波的目的,不仅降低了信号分析的复杂度,而且能够提取更显著的时域特征。

对合并之后的波形计算每个波的周期和幅值,提取睡眠分期规则所依据的各期特征波形的时长占比和平均幅值作为特征。

实验结果表明
该方法是一种有效的睡眠脑电信号处理方法,可以自适应于不同的节律波。

通过将双向LSTM神经网络分类器与支持向量机分类器和随机森林分类器进行对比,结
果表明双向LSTM神经网络可以有效利用睡眠数据的时间上下文信息而提高睡眠
分期准确率。

本文仅仅根据波形周期对不同睡眠阶段的节律波进行划分,但是K
复合波,睡眠纺锤波,眼电通道的快速眼动信号等特征波形仅根据周期划分易与其他节律波混淆,在进一步的研究中可以根据波形的其他特征做更细致的划分。

双向LSTM神经网络等深度学习算法相对于传统机器学习算法模型复杂度高,容易过拟合。

因此选择合适的神经网络架构,提高模型的泛化能力是以后的研究重点。

【相关文献】
[1]Iber C,Ancoli-Israel S,Chesson A,et al.The AASM manual for the scoring of sleep and associated events:rules,terminology and technical specifications[M].Westchester,IL:American Academy of Sleep Medicine,2007.
[2]Chambon S,Galtier M,Arnal P,et al.A deep learning architecture for temporal sleep stage classification using multivariate and multimodal time series[J].arXiv preprint arXiv:1707.03321,2017.
[3]Burns J W,Crofford L J,Chervin R D.Sleep stage dynamics in fibromyalgia patients
and controls[J].Sleep Medicine,2008,9(6):689-696.
[4]张泾周,周钊,滕炯华,等.基于神经网络的睡眠分期处理算法研究[J].计算机仿真,2010(8):141-144.
[5]李谷,范影乐,李轶,等.基于脑电信号 Hilbert-Huang变换的睡眠分期研究[J].航天医学与医
学工程,2007,20(6):458-463.
[6]Fraiwan L,Lweesy K,Khasawneh N,et al.Automated sleep stage identification system based on time-frequency analysis of a single EEG channel and random forest classifier[J].Computer Methods and Programs in Biomedicine,2012,108(1):10-19. [7]Hochreiter S,Schmidhuber J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[8]Graves A,Mohamed A,HintonG.Speechrecognition with deep recurrent neural networks[C]//2013 IEEE International Conference on Acoustics,Speech and Signal
Processing,2013:6645-6649.
[9]Sutskever I,Vinyals O,Le Q V.Sequence to sequence learning with neural
networks[C]//Advances in Neural Information Processing Systems,2014:3104-3112. [10]Pham V,Bluche T,Kermorvant C,et al.Dropout improves recurrent neural networks for handwriting recognition[C]//2014 14th International Conference on Frontiers in Handwriting Recognition,2014:285-290.
[11]Supratak A,Dong Hao,Wu Chao,et al.DeepSleepNet:a model for automatic sleep stage scoring based on raw singlechannel EEG[J].arXiv Preprint arXiv:1703.04046,2017.
[12]Graves A,Schmidhuber J.Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J].Neural Networks,2005,18(5):602-610. [13]Wei Z,Zou J,Zhang J.Automatic recognition of chewing noises in epileptic EEG based on period segmentation[J].Neurocomputing,2016,190:107-116.
[14]Ben-Av M B,Sagi D.Perceptual grouping by similarity and proximity:experimental results can be predicted by intensity autocorrelations[J].Vision Research,1995,35(6):853-866.
[15]Jin X,Zou J,Zhang J.The application of visual organization principle in the detection of sleep spindles[J].Journal of Biomedical Science and Engineering,2017,10(5):1. [16]Burke D P,Kelly S P,de Chazal P,et al.A parametric feature extraction and classification strategy for braincomputer interfacing[J].IEEE Transactions on Neural Systems and Rehabilitation Engineering,2005,13(1):12-17.
[17]刘冰.生物信号噪声消除的数字滤波器研究[D].上海:上海交通大学,2008.
[18]高群霞,周静,吴效明.基于脑电信号的自动睡眠分期研究进展[J].生物医学工程学杂志,2015,32(5):1155-1159.
[19]Zhang J,Zou J,Wang M,et al.Automatic detection of interictal epileptiform discharges based on time-series sequence merging method[J].Neurocomputing,2013,110:35-43.
[20]Hsu Y L,Yang Y T,Wang J S,et al.Automatic sleep stage recurrent neural classifier using energy features of EEG signals[J].Neurocomputing,2013,104:105-114.
[21]Sak H,Senior A,Beaufays F.Long short-term memory recurrent neural network architectures for large scale acoustic modeling[C]//Fifteenth Annual Conference of the International Speech Communication Association,2014.
[22]Lipton Z C,Berkowitz J,Elkan C.A critical review of recurrent neural networks for sequence learning[J].arXiv preprint arXiv:1506.00019,2015.
[23]Wang W,Chang B.Graph-based dependency parsing with bidirectional
LSTM[C]//Proceedings of ACL,2016.
[24]Hermans M,Schrauwen B.Training and analysing deep recurrent neural
networks[C]//Advances in Neural Information Processing Systems,2013:190-198.
[25]Srivastava N,Hinton G E,Krizhevsky A,et al.Dropout:a simple way to prevent neural networks from overfitting[J].Journal of Machine Learning Research,2014,15(1):1929-1958.
[26]姜枫,张丽红.基于随机Dropout卷积神经网络的人体行为识别方法研究[J].测试技术学报,2016(1):17-22.。

相关文档
最新文档