2024机器学习在癫痫方面的应用进展(全文)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2024机器学习在癫痫方面的应用进展(全文)
摘要
癫痫是由脑部神经元高度同步化异常放电引起的发作性、短暂性、刻板性的脑功能失调,发作时机难以预测,目前主要治疗方式为抗癫痫药物与手术治疗。
其诊断和治疗需要大量的辅助手段与临床经验。
在癫痫的发作预测、药物治疗预后、手术治疗评估等多个临床方面,机器学习可以通过对数据的深层次挖掘、纳入多个临床和影像因素、建立对应的学习模型,提高癫痫的诊断效率与准确性,实现抗癫痫药物的个体化应用,改善癫痫患者的术前评估与预后情况。
目前在诊治癫痫过程中,对于评估癫痫发作区定位、症状诊断、药物应用等方面,神经影像学以及脑电图是重要的辅助手段,但分析仍需要付出极多的时间与努力,且由于脑电图和神经影像学的分析多依赖于医师本身的视觉和主观判断,存在较多的人为误差。
机器学习的机制[1 ]是通过学习大量数据发现规律并建立相应模型,对模型进行不断的验证和改进,根据概率的分布确定最支持的结果,从而完成对新的数据的识别与预测。
机器学习[2 ]可分为监督学习、无监督学习、强化学习,包括多元Logistic回归、支持向量机、随机森林、人工神经网络等几十种算法,吸收了传统统计学中的算法作为临床算法,
但具有传统统计学不能达到的提取和分析大量数据集的能力。
目前机器学习的一般过程包括:收集数据(收集模型相关的数据并进行标准化、去重复、错误修正)、数据处理(对数据的统计学等特征进行分析、确定自变量与因变量,并将数据分为训练集和验证集)、特征处理(将收集的数据转换为机器学习可用的数字特征,通过一些函数将数字特征转换为更加适合机器学习模型的特征数据)、建立模型(选择合适的机器学习算法建立模型,并应用训练集数据进行训练和调优)及模型验证(将验证集数据输入模型中进行验证)。
深度学习是机器学习的最新分支,主要通过建立人工神经网络进行学习,分为输入层、隐藏层和输出层,可以将患者数据作为原始数据进行处理,并自行识别数据特征进行分类,节省了传统的机器学习方法中人工提取特征的过程,避免了筛选特征过程中数据的丢失。
近年来提出了10余种深度学习模型,包括循环神经网络、自编码网络、深度残差网络、循环神经网络、卷积神经网络、递归神经网络等,目前常用的是卷积神经网络[3 , 4 ]、递归神经网络[5 ]等。
目前机器学习在癫痫方面已应用于辅助诊断[6 ]、发作预测[7 ]、治疗方案的决定与疗效预测[8 ]、辅助手术治疗[9 ]等多个方面。
本文作者以“Epilepsy”“Electroencephalography”“Machine learning”“Surgery””Anti-seizure medication“为检索词,在PubMed、Web of Science数据库检索了2010年至2023年的相关文献,总结了近年来
机器学习在癫痫方面的应用进展,旨在为临床诊治提供帮助。
一、机器学习在脑电图方面的应用
根据癫痫发作活动的发生,癫痫可分为4个部分:间歇期、发作前期、发作期和发作后期[10 ]。
癫痫患者在发作前或发作时会出现脑细胞的痫样放电,在脑电图上表现为不同类型的棘波、慢波、尖波、棘慢复合波等波形,通过提取脑电图中的这些特征,可以达到预测癫痫发作、识别癫痫灶和预测患者预后的目的。
(一)在癫痫发作预测方面的应用
研究结果表明癫痫患者从正常状态到发作状态并不是瞬间转变的,而是经历了一个过渡时期,即发作前期,准确和高效地对患者的发作前期进行识别将成为癫痫预测技术的关键点[11 ]。
预测方法的困难在于不同患者的脑电图及同一患者脑电图之间的异质性,因此需要对脑电图数据进行预处理、特征提取和特征分类。
2017年研究者提出了使用多通道脑电图数据的多类支持向量机(support vector machines,SVM)模型[12 ],结合高斯函数、复小波变换等多种数据处理方法对来自欧洲癫痫数据库的216 例患者的脑电图数据,包括185 份头皮脑电图记录和31份颅内脑电图数据进行学习和验证,总体灵敏度为0.384,每小时假阳性率为0.200。
该模型较2011年提出的通过
高斯函数对癫痫患者发作前期脑电图数据进行处理的人工预测模型[13 ]灵敏度提高,且避免了人工判读脑电图数据的误差,缩短了预测时间。
2022年研究者对颞叶癫痫患者发作前期脑电图数据进行数据处理,提取5个数据集各包括100个脑电图片段样本,并输入到SVM、决策树、快速傅里叶变换等机器学习方法中建立癫痫发作预测模型[14 ],在印度一家医院的实时数据中获得的预测准确率为0.916 7,结果证明以癫痫患者发作前期的脑电图作为训练集的机器学习模型对癫痫发作预测的准确率和灵敏度较人工预测模型明显提高。
最近在2021年提出了基于特征金字塔网络的深度学习模型[15 ]。
特征金字塔网络是一种融合了多尺度特征、时域形态学分析和传感器空间相关性分析的特征检测框架。
通过该框架对30例癫痫患者发作前期脑电图数据进行特征提取,识别脑电图中尖波、棘波、棘慢复合波等特征,进而输入至深度学习模型中进行学习和验证,准确度为0.951,达到了先进的检测性能,优于传统的机器学习模型,且减少了寻找特征过程中数据的丢失。
除此之外还有研究者提出了基于脑电信号的卷积神经网络[16 , 17 ]、长短期记忆网络[18 ]、自编码器网络[19 ]的癫痫预测和诊断模型,均取得了较高的预测准确率。
(二)在癫痫手术病灶定位与疗效预测方面的应用
全世界约有1/3的患者对各类抗癫痫药物反应不良[20 ]。
目前对
于耐药性癫痫患者推荐的治疗方法[21 ]是手术切除致痫区,致痫区与手术切除区是否一致须通过术后患者癫痫是否得到控制进行判断。
因此,通过脑电图在术前识别致痫区和预测手术疗效是目前机器学习的研究热点。
在2011年,研究者便提出利用立体定向脑电图(stereoelectroencephalography,SEEG)对致痫区进行预测[22 ],但是主要通过人工识别立体脑电图的特征,存在着高耗时和高主观性的缺点。
有研究者利用癫痫发作前期SEEG的多个生物标志物(癫痫样放电、高频振荡、相位振幅耦合)及其时域特征训练的预测模型,收集了82例局灶性癫痫患者的脑电图,将由4 966个电极采集的标准化特征分为60%的训练集和40%的验证集,并输入SVM算法,用于识别致痫灶,测试数据集的曲线下面积(area under the curve,AUC)为0.79,验证集为0.73,为未来利用机器学习模型定位致痫区提供了证据[23 ]。
更进一步的是在2021年一项研究中提出的利用SEEG定位难治性癫痫患者致痫灶的监督式学习模型[24 ]。
从41例植入SEEG电极超过24个月的患者中挑选出10例3年以上无癫痫发作的耐药局灶性癫痫患者,对脑电图数据进行特征提取,以出度中心、入度中心、强度中心、特征向量中心等作为分类器的特征,并将数据经过重采样方法分为不同的数据集,输入进包括决策树、SVM、Logistic回归、贝叶斯模型、K-近邻等10种不同的机器学习算法进行学习和验证,使用AUC、F测度、几何均值和平衡精度对学习模型性能进行评估,其中SVM模型的性能较其他模型突出,
重采样技术的AUC为0.79±0.05,高于欠采样技术的AUC(0.78±0.06)。
事实证明监督式机器学习模型和数据重采样方法可以提高发作前期立体脑电图致痫灶定位的准确性和灵敏性,并避免了分析过程的主观性和耗时问题。
在预测癫痫手术疗效方面,最近提出了利用卵圆孔脑电图的监督学习模型[25 ],纳入了26例应用卵圆孔脑电图的癫痫患者,采用多元Logistic 回归算法,提取性别、癫痫发作年龄、当前和以前的抗发作药物(anti-seizure medication,ASM)总数、癫痫发作生物学标志、癫痫病灶的侧向化、局灶性意识受损的数量和局灶性等为算法特征,采用重复交叉验证对学习模型进行检测。
结果显示基于经卵圆孔脑电图的机器学习模型的AUC为0.74±0.23,对达到Engel Ⅰ级(即无致残性癫痫发作)结果患者的预测准确性为0.68±0.18,与基于临床、头皮脑电图及硬膜外脑电图数据的预测模型[26 ]相比有显著提高(准确率为0.65),但卵圆孔脑电图属于侵入性操作,目前未能普及,在应用上存在限制。
二、机器学习在神经影像学方面的应用
神经系统影像可以将大脑的结构异常与功能异常相结合,这是脑电图所不能做到的。
一场全球性的关于癫痫患者脑结构异常的荟萃分析[27 ]汇集了来自欧洲、北美和南美、亚洲和澳大利亚14个国家的24个研究中心的数据,结果表明在广泛的疾病类型中,癫痫具有共同的神经解剖学特征,为机器学习通过神经影像学对癫痫进行诊治提供了证据支持。
另外随
着功能连接组学的提出,机器学习在神经影像学的应用得到进一步拓展。
功能连接组学[28 ]将大脑视为各区域间相互链接的网络,借助影像学工具可测量其局部和整体功能特性,进而输入机器学习模型中对大脑病变做出预测和诊断。
(一)在癫痫的诊断与预测方面的应用
1996年开发的一种基于头颅MRI以及PET的称为“The Viewing Wand”的框架模型[29 ]是机器学习最早应用于影像学分析的模型,但在准确度和灵敏度方面存在较大缺陷。
随着科技的不断进展,研究者提出了新的机器学习模型[30 , 31 ]对癫痫进行诊断和发作预测。
静息状态功能MRI可以动态反映大脑各区域之间的连接性以及功能状态[32 ]。
近年来有研究者以癫痫患者静息状态功能MRI的数据建立了诊断模型[33 ],采用包括极端梯度提升树(XGBoost)、SVM、随机森林算法的监督式学习方法区分63例癫痫患者和259名健康对照者,结果XGBoost的验证AUC为0.81,测试AUC为0.79,准确率为0.74,优于另外两者。
除此之外还有研究者利用静息状态功能MRI的机器学习模型[34 ]区分颞叶癫痫患者与正常对照。
通过利用癫痫患者的影像学数据进行有向脑网络构建,使用双样本t检验选择特征输入SVM模型进行训练,结果显示使用影像学最优特征训练的SVM分类器对颞叶癫痫患者和正常对照患者的分类准确率可达0.945 5,证明利用癫痫患者静息
状态功能MRI数据训练的机器学习算法可作为癫痫诊断的辅助手段。
2022年,有研究者更进一步地使用深度学习算法建立颞叶癫痫的诊断模型[35 ]。
共研究了2 132名健康对照和32例术前颞叶癫痫患者,通过采集颞叶癫痫患者的原始静息状态功能MRI数据及去除线性趋势、时间低通滤波、空间平滑和干扰参数(头部运动、白质、心室和全局信号)及其时间导数的回归等处理生成训练集,将其用于训练三维卷积神经网络,之后在颞叶癫痫患者中进行测试,结果显示该模型诊断颞叶癫痫患者的总体准确率为0.906,证明该模型能够在经过数据训练后做出准确的诊断,从而调整颞叶癫痫患者的术前手术计划和改善预后。
对于MRI阴性的癫痫患者,扩散峰度成像可以在分子水平上分析局部组织和癫痫灶其他区域的病理变化。
有研究者通过基于扩散峰度成像的机器学习方法建立癫痫诊断模型[36 ]。
该研究采集了59例海马癫痫患儿和70名年龄和性别匹配的正常对照的T 1加权图像和扩散峰度成像图像,将扩散峰度成像中的海马体作为局部大脑区域进行分割,并估计每个受试者海马体的峰度张量。
输入SVM算法模型进行癫痫识别,得到了0.952的准确率,实现了对MRI阴性癫痫患者的准确识别。
在该研究基础上,研究者进一步以基于迁移学习技术的卷积神经网络算法建立深度学习模型[37 ],收集癫痫患者的扩散峰度成像数据,提取FA、MD、MK特征,融合FA和MK,对学习模型进行训练以识别癫痫患者,实现了0.908的分类准确率。
以上均证明了基于扩散峰度成像的机器学习模型可以作为MRI阴性的癫痫患者的诊断辅助工具,加强了针对癫痫患者病
因的治疗。
(二)在癫痫术前评估与疗效预测方面的应用
神经影像学是术前致痫灶定位的核心工具,通过机器学习算法分析术前与术后影像学信息,可以推断手术对患者特定脑网络的影响,从而达到对癫痫手术的术前评估和疗效预测。
2013年有研究者提出了基于氟脱氧葡萄糖正电子发射体层摄影(FDG-PET)数据对颞叶癫痫进行辅助诊断和致痫灶定位的机器学习模型[38 ],对右侧颞叶癫痫定位的准确度为0.85,左侧为0.83。
该模型局限于对颞叶癫痫进行分类,不能准确地识别致痫灶的范围。
近期基于18F-氟脱氧葡萄糖正电子发射体层摄影(18F-FDG PET)的深度学习模型[39 ]被提出,用于儿童颞叶癫痫的致痫灶的定位。
通过对201例儿童颞叶癫痫患者的18F-FDG PET图像进行定量分析,建立卷积神经网络精确定位致痫灶。
将该机器学习模型的性能与视觉评估、统计参数映射软件和基于Jensen-Shannon散度的Logistic回归(JS-LR)分析进行比较,结果显示学习模型的骰子系数为0.51,显著高于统计参数映射(0.24,P<0.01),所建立的18F-FDG PET图像学习框架能够准确、高效地识别癫痫病灶,较之前的机器学习模型准确度明显提高,可作为未来癫痫患者术前评估的辅助方法。
在预测手术疗效方面,有研究者提取了术前FDG-PET和术前、术后T 1
加权MRI扫描的图像特征,输入到机器学习模型[40 ]中对内侧颞叶癫痫患者手术疗效进行预测。
结果显示Logistic回归、SVM、随机森林和人工神经网络等机器学习算法对达到Engel Ⅰ级结果患者的预测准确度在70%~80%,其中关于手术中切除的总组织和显著低代谢组织的总体范围的信息对机器模型的预测性能至关重要。
有研究者更进一步将术前MRI、PET、CT和术后MRI结合构建癫痫患者术前靶区的神经成像,共同应用于机器学习模型[41 ]。
将影像特征输入多核SVM进行整合学习,结果显示SVM的预测准确度、灵敏度和特异度分别为0.914、0.962和0.854,高于之前单纯采用FDG-PET的机器学习算法。
且该模型在缺乏其他两种影像学检测数据的情况下,仍能有效地对癫痫手术结果进行预测,减少了样本量的需求。
研究结果证明机器学习算法[42 , 43 ]可以通过神经影像学特征为难治性癫痫患者提供手术决策相关的信息。
根据疗效预测结果,可以及时修改手术计划,优化癫痫灶选择面积,改善手术预后,减少并发症发生。
但由于部分影像学检查费用昂贵并且绝大多数基层医院无法进行,可能会使其应用受到局限。
三、多模态数据机器学习模型在癫痫诊治方面的应用
机器学习的优势之一便是可客观地处理多模态、存在相互矛盾的数据,得到较为公允的结果。
(一)多模态数据机器学习模型在患者药物疗效预测方面的应用
ASM是治疗癫痫的主要手段之一,目前临床常用服药后癫痫发作的类型、频率及严重程度有无改善[44 ]等临床表现进行药效评估。
人工评估患者对ASM反应性耗时过长,且过程中存在病情反复或加重的风险,为患者带来较大痛苦。
多模态数据机器学习算法可以缩短这一过程,降低与耐药性癫痫相关的发病率和病死率。
研究者在2019年提出了一项监督学习算法[45 ],用于预测新诊断癫痫患者对ASM包括卡马西平、奥卡西平、丙戊酸钠、拉莫三嗪、左乙拉西坦、托吡酯和加巴喷丁的反应性,收集了2 017例新诊断癫痫患者的信息,对患者进行前瞻性随访至少3年。
选择人口统计学、病史和辅助检查(脑电图和MRI)等方面的特征输入决策树、随机森林、SVM、XGBoost 和Logistic回归5种经典的机器学习算法建立预测模型。
癫痫发作结果分为缓解和未缓解。
结果显示上述机器学习算法中XGBoost的F1得分(查重率和查全率的调和平均值)为0.947,AUC为0.979,对ASM疗效的预测性能最好,较之前的机器学习模型[46 ]显著提高(0.70),且缩短了预测所需的时间。
也有研究者提出了利用临床因素和弥散张量成像特征进行训练的机器学习算法[47 ],用于预测局灶性癫痫患者对ASM的反应性。
研究纳入了160例新诊断的接受过弥散张量成像检查的局灶性癫痫患者,并在癫痫诊断后随访至少12个月,定期评估ASM疗效,采用了SVM算法进行预测,得到了0.875的准确率,AUC为0.882,稍逊于前一项研究。
除此之外,一项基于19通道脑电图的机器学习模型[48 ]被应用于
预测左乙拉西坦的抗癫痫效果。
采集应用左乙拉西坦的23例新发癫痫患者前后3个月的脑电图,采用19个通道中T0(左乙拉西坦开始前的脑电图)和T1(左乙拉西坦开始3个月后的脑电图)的脑电图有效功率为自变量,共152个特征,以偏最小二乘回归算法建立预测模型,得到了较为准确的预测结果(AUC=0.800)。
19通道脑电图成本较低,目前应用于大多数癫痫治疗中心,因此得到验证的该机器学习模型可在未来得到广泛应用。
一项2021年的前瞻性研究提出了基于脑电图的特征预测奥卡西平用于新诊断局灶性癫痫患者治疗结局的预测模型[49 ],梯度提升决策树-柯尔莫果洛夫复杂度和梯度提升决策树-伦佩尔-齐夫复杂度两个机器学习算法分别得到了0.64和0.92的灵敏度。
上述研究结果证明了利用药物治疗引起的脑电图改变进行学习的预测模型可以预测长期治疗效果(即持续至少2年的癫痫无发作),且较人工预测模型[50 ]在准确度和灵敏度上有明显提升。
未来可在此基础上建立一种定量的、个体化的药物反应预测模型,可以帮助临床医生更有针对性地使用ASM,最大限度地减少治疗相关不良反应。
(二)多模态数据机器学习模型在癫痫手术疗效预测方面的应用
在癫痫领域,早在2015年便提出了利用多模态数据训练机器学习模型[51 ]对内侧颞叶癫痫患者手术预后进行预测。
采用最小冗余最大相关算法对临床特征进行筛选,确定了癫痫家族史、初始脑电图发作模式等特征为预测因子,将这些临床特征与最小二乘SVM分类器结合使用,可
以获得0.95的手术预测准确率,比局限于单方面数据的预测模型准确率明显提高。
近年来,一项多中心回顾性研究新提出了多模态的监督学习模型[52 ]用于小儿癫痫手术疗效的预测,以临床特征、术前评估及其手术部位等为预测因子,收集了801例患者的数据构成特征集,用于Logistic回归、随机森林、决策树、XGBoost、朴素贝叶斯、神经网络和SVM 7种机器学习算法的训练,预测术后1年无癫痫发作的结果。
其中XGBoost 监督学习算法与单变量特征集中5个特征的组合,包括抗癫痫药物数量、MRI 病变、癫痫发作年龄、脑电图特征和手术类型,得到的AUC为0.73,优于其他模型。
该模型较之前仅利用脑电图[24 ]或影像学数据[40 ]的机器学习模型准确度有所提高。
上述研究结果均证明了多模态数据机器学习模型在预测癫痫手术疗效方面优于传统的Logistic回归模型和单数据模型。
机器学习可以在冗杂的多模态数据中挖掘出潜在的可应用于临床的关键信息,在目前大数据量、大计算量的科研环境中计算出精准的结果。
四、联合人类专家的机器学习模型在癫痫方面的应用
目前机器学习算法仍存在着准确度与特异度等方面的限制,于是有研究者提出借助人类专科医生对机器模型进行监督与校正,在减少专科医生工作量的同时提高机器学习模型的准确度。
在2022年,研究者对应用全自动方法和混合方法(即通过癫痫专业专家监督)识别发作间期癫痫样放电的机器学习模型[53 ]进行了对比,收集了30例癫痫患者和30例非癫痫患者的20分钟脑电图记录作为独立验证数据集,其中非癫痫患者组包括心因性非癫痫发作(12例)、睡眠障碍(10例)、阵发性运动障碍(4例)和晕厥(4例)患者,并利用其脑电图的瞬时爆发对机器算法进行压力测试。
3名专家具有超过10年的脑电图阅读经验,独立评估了20 min的脑电图记录,并对癫痫样放电进行单独标记;而3种机器学习算法Encevis、SpikeNet和Persyst,分别经过独立训练数据集的训练。
结果显示,3种机器学习算法对癫痫样放电的检出具有较高的灵敏度(分别为96.67%、66.67%、100.00%),但特异度较低(分别为16.67%、63.33%、3.33%),基本无法应用于临床。
结合3位专家的混合方法在准确度方面可达到93.33%、76.67%和86.67%,但特异度显著高于全自动方法(分别为93.33%、96.67%、96.67%)。
在更进一步的机器算法出现之前,人工和机器学习算法的结合是该技术应用于临床的主要手段。
五、机器学习在癫痫诊治方面的限制
机器学习目前已深入医学领域各个方面,在癫痫快速诊断、制定治疗方案、评估患者预后等方面出现了突破性的进展,但目前仍存在着诸多限制:
1. 机器学习模型的建立与验证需要大量的数据作为支持,临床数据的缺失、数据质量良莠不齐等均会影响机器学习模型预测结果的精准性。
2. 针对癫痫患者的机器学习模型所需的特征提取,目前仍存在较大限制,特征提取的错误会严重影响机器学习模型的准确度和特异度。
3. 目前的全自动机器学习算法在对数据的特征检出方面仍有一定的限制,临床的应用仍依赖相关方面专家的监督与校正。
4. 目前仍缺少较为完整的癫痫患者的数据库,且来自不同中心的数据在一定程度上存在着误差,造成偏倚,使得机器学习的应用存在限制。
六、总结与展望
癫痫患者的个体化和闭环治疗是机器学习下一阶段的发展趋势,随着大数据时代的来临和多学科领域的结合,机器学习在癫痫诊治中将有着更广泛的应用,从而改变癫痫诊疗过程,减少患者所遭受的痛苦,使医患双方共同获益。