人工智能深度学习在乳腺癌病理诊断中的研究进展

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人工智能深度学习在乳腺癌病理诊断中的研究进展
摘要:乳腺癌是全球女性最常见的癌症。

病理诊断是癌症诊断的金标准,但癌症病理诊断过程的复杂性和病理医师的缺乏,为人工智能在乳腺肿瘤辅助诊断领
域提供了广阔的机遇。

基于深度学习的人工智能使计算机自动处理病理数据并辅助精确诊断成为可能,但目前人工智能在病理诊断领域的应用依旧处于发展初
级阶段,并且相关技术的研发仍不完善,其面临的巨大挑战和美好前景并存。

本文综述了近几年基于深度学习的人工智能在乳腺癌的常规和术中快速组织病理
学诊断、组织学分级、淋巴结转移诊断、分子分型免疫组化定量检测、分子病理学诊断、预测乳腺癌预后这六个方面的应用进展,并讨论其存在的局限性以及实际应用的巨大前景。

关键词:乳腺癌; 人工智能; 深度学习; 病理诊断
一、引言
乳腺癌作为全球女性最常见的癌症之一,其早期准确诊断对于提高患者生存率和生活质量至关重要。

传统的病理诊断方法依赖于病理医师的专业知识和经验,但受限于诊断过程的复杂性和病理医师的缺乏,使得乳腺癌的诊断效率和准确性面临挑战。

近年来,随着人工智能(AI)和深度学习(DL)技术的飞速发展,其在乳腺癌病理诊断领域的应用展现出巨大的潜力和前景,为乳腺癌病理诊断提供了新的解决方案。

这些深度学习技术有各自不同的特点,其中,CNN的结构设计是以生物视觉皮层为动机,能够非常有效地提取具有上下文数据的特征。

学者谢婷认为近年来,AI的深度学习(deep learning,DL)逐渐成为乳腺癌病理诊断AI研究领域的主流。

DL算法通过多层神经网络处理数据,在图像识别等问题上具有优越性,可以提取出多维度的高维特征,能反馈出有效的诊断或预后信息。

相比于传统的临床诊断方法,DL算法能够早12个月诊断出乳腺癌。

二、正文
1 深度学习的概念
深度学习(Deep Learning)是机器学习的一个分支,它基于人工神经网络(Artificial Neural Networks,ANN)的研究,通过构建和训练深层的神经网络模型,来解决各种复杂的机器学习问题。

与传统的机器学习算法相比,深度学习在处理原始、未加工的数据(如图像、文本或声音)时具有显著的优势。

深度学习的核心思想是通过模仿人脑神经网络的连接结构,构建多层次的神经网络模型。

这些模型通常包括输入层、隐藏层和输出层,其中隐藏层可以有多个,每一层都包含多个神经元(或称为节点)。

每个神经元都与前一层和后一层的神经元相连,通过连接权重(weights)和偏置(biases)来传递信息。

在训练过程中,深度学习模型会通过反向传播算法(Backpropagation)来逐层调整连接权重和偏置,以最小化预测值与实际值之间的误差。

这种优化过程通常使用梯度下降(Gradient Descent)或其变种算法来实现。

通过不断迭代和优化,深度学习模型能够学习到输入数据中的内在规律和表示层次,从而实现对新数据的准确预测和分类。

深度学习已经在许多领域取得了显著的成功,包括计算机视觉、自然语言处理、语音识别、推荐系统、游戏AI等。

例如,在计算机视觉领域,深度学习模型已经能够实现对图像和视频的自动分类、目标检测、图像分割等任务;在自然语言处理领域,深度学习模型已经能够实现对文本的情感分析、机器翻译、问答系统等任务。

这些应用不仅提高了任务的自动化程度,也推动了相关领域的快速发展。

学者谢婷认为:DL通过学习样本数据来自动确定输入数据中的特征所存在的内在规律和表示层次。

基于DL的方法的主要优点是它对相关模式的识别方案所需要的人工干预更少,这使得它能够有效地解决各个领域的复杂问题,如图像分析,模式识别和自然语言处理等。

2 深度学习在乳腺癌病理诊断中的主要应用
2.1常规及术中冰冻快速组织病理学诊断
目前,DL算法已逐步应用于胃癌、乳腺癌等疾病的组织病理学的常规诊断,并且取得了一定的进展。

CNN作为目前使用最广泛的DL算法,已应用于乳腺癌病理图像的检测和分割任务等,以识别和量化细胞、组织学特征。

学者Araújo等开发了一种以CNN为基础的DL算法,对乳腺病理图像进行分类,其一分为癌和非癌两类,准确率为83.3%;其二分为正常组织、良性病变、原位癌和浸润癌四类,准确率为77.8%。

学者Cruz-Roa等通过对不同站点的近400 个样本进行模型训练,采用CNN
从载玻片图像上自动识别是否存在浸润性肿瘤,实验结果表明,该方法能够以高
精度检测整个载玻片组织病理学图像上的诊断病理学杂志2024 年5月第31卷第5期·461·浸润性乳腺癌区域。

学者Bejnordi 等开发了一种基于CNN的模型,通过将DL算法应用于分析基质的特征,以此区分乳腺癌和良性病变。

此外,随着人工智能的蓬勃发展,DL 在乳腺癌术中冰冻切片诊断的应用也逐渐走向成熟。

2023年,笔者团队提出了SVGG模型,这是一种在VGG模型的基础上进行创新的术中快速冷冻切片诊断模型。

SVGG网络在训练阶段通过向交叉熵添加penalty参数来采用变换损失函数,以此对术中快速冷冻切片的乳腺癌组织病理学图像进行分类。

训练结果显示,与VGG相比,SVGG在乳腺癌术中诊断的应用具有更高的稳定性和更良好的性能,并且其准确率高达88.70%。

2.2组织学分级
核分裂象计数、小管形成和核异型性是乳腺癌组织学分级的三个重要因素。

其中检测核分裂象技术任务繁重,且检测时具有一定的主观性,但是人工智能深度学习在这方面有优越性,它可以自动检测识别疑似该现象的出现,经过多次训练网络过滤掉假阳性细胞,以此达到高效地辅助癌症的分级。

学者Couture等使用DL的图像分析来预测乳腺癌分级,开发并运用了其他算法,以允许客观计数有丝分裂图像,测量核的形状和大小,以及自动检测和分割组织病理学图像中的细胞核。

学者Ciregan等首次将CNN应用于基于H&E切片的乳腺癌有丝分裂计数。

学者Dalle等提出一种多分辨率方法,其用于自动乳腺癌组织病理学分级,在低分辨率的全局图像中检测到管状结构,在高分辨率的图像帧中检测和分类单个细胞,然后根据诺丁汉体系的三个准则对它们进行评分。

测试结果表明,系统计算的不同等级与病理学家给出的等级非常吻合。

2.3淋巴结转移诊断
淋巴结转移是指恶性肿瘤细胞通过淋巴管转移至淋巴结,并在淋巴结内形成病灶,进而引起淋巴结肿大、质地变硬等表现。

它是恶性肿瘤常见的转移途径之一,也是病情恶化的重要标志之一。

如今已有大量研究将DL算法应用于识别肿瘤淋巴结转移情况。

学者Ehteshami等在荷兰于2017年开展的淋巴结癌转移挑战赛,参赛团队中大多数采用的是基于CNN的算法,通过训练数据集来完成识别单个转移瘤、转移的分类这两项任务,研究表明诊断最佳的团队平均曲线下面积为0.810,最佳人工智能算法为0.994,并且基于深度学习的算法的性能都明显优胜于其他算法。

2019年,学者Dihge等通过DL技术进行训练,内容为:针对肿瘤临床病理特征,开发了一种基于神经网络的预测模型,研究对象为800名患有原发性乳腺癌的患者。

经过显示,预测效果达到最佳的是肿瘤大小和淋巴血管浸润状态这两个临床病理特征。

该模型有助于检测组织病理学载玻片上的淋巴结转移情况,以及评估乳腺恶性肿瘤中非前哨淋巴结受累的风险。

2.4分子分型免疫组化定量检测
分子分型免疫组化定量检测是一种综合性的医学检测技术,它结合了分子检测和免疫组化的方法,用于更精确地确定肿瘤的性质、分型和指导治疗。

乳腺癌分子亚型主要由免疫组化雌激素受体(estrogen receptor,ER)、孕激素受体(progesterone receptor,PR)、人表皮生长因子受体2(human epidermal growth factor receptor 2,HER2)、增殖相关基因Ki-67等界定,各分子亚型具有较大异质性,并且乳腺癌基因组改变复杂,突变类型多样。

学者谢婷等认为,计算机可以通过DL定量计算评估ER、PR、HER2及Ki-67等表达水平,可以减少医生在病理诊断时的主观性和差异性,为乳腺癌的精准诊断带来有效的价值,为临床医生提供了更加客观的治疗依据。

学者Rexhepaj等设计了一种核检测算法,用于量化ER和、PR的免疫组化表达,发现手动和算法定量之间的相关性为0.9。

2018年,Saha和Chakraborty提出的模型Her2Net对HER2自动评分,准确率高达96.64%。

2020年,Rawat等通过DL对ER、PR、HER2的免疫染色体进行评估,以预测乳腺癌临床亚型。

他们引出“指纹网络”的概念,用无标记的方法利用大型没有注释的数据集来学习区分不同患者的H&E特征,训练一个分类器,其基于补丁来预测分子标记状态,结果发现“指纹网络”可以匹配患者,准确率达到93%。

2.5分子病理学诊断
深度学习中分子病理学诊断的应用结合了深度学习的算法优势与分子病理
学的精确性,为病理诊断带来了革命性的变化。

近年来,基于深度学习的人工智能算法在乳腺癌分子病理诊断领域取得了突破性的进展。

学者Gao等人建立了一种新的监督分类框架,其基于多层人工神经网络功能实现的,即深层癌症亚型分类(DeepCC)。

该框架能能捕获与不同分子亚型相关的生物学特征,并且其对缺失数据而言具有稳定性,可用于单样本预测,有助于临床实施癌症的分子分型。

Shimizu等开发了一种新的预测乳腺癌患者预后的框架,使用基于人工智能的神经网络算法建立了一个通用分子预后评分系统(mPS),该
评分系统仅依赖于与预后相关的184个基因中的23个基因的表达状态。

结果表明,mPS 能够精确预测乳腺癌患·462·J Diag Pathol,May 2024,Vol.31,No.5
者的总生存期和无病生存期,且mPS适用于大多数乳腺癌亚群。

2023 年,Rahaman 等构建了一个基于深度学习的框架Breast ST-Net,一种使用空间转录组学数据预测乳腺癌组织病理学图像基因表达的框架。

此框架尝试了4种不同的深度学习架构,其中包括ResNet,InceptionNet,EfficientNet的六个变体和两个视觉转换器模型。

训练结果显示,其可以从组织学图像中学习空间特征并预测基因表达水平,并且能够预测出237个正相关基因。

2.6预测乳腺癌预后
深度学习在预测乳腺癌预后方面展现出显著的优势和潜力。

主要采用的方法有:
卷积神经网络(CNN):CNN是深度学习中最常用的算法之一,它主要用于处理图像数据。

在乳腺癌预后预测中,CNN可以通过对乳腺X光片、MRI等医学图
像的分析,提取出与乳腺癌预后相关的图像特征,并构建预测模型。

例如,通过卷积层对图像进行特征提取,通过池化层对特征进行降维,最后通过全连接层对特征进行分类和预测。

递归神经网络(RNN):RNN主要用于处理序列数据,如时间序列数据、文本数据等。

在乳腺癌预后预测中,RNN可以通过对乳腺癌患者的遗传数据、临床表现数据等序列数据的分析,提取出与乳腺癌预后相关的序列特征,并构建预测模型。

RNN能够捕捉数据中的时间依赖性和上下文信息,对于预测乳腺癌的复发和转移等预后情况具有重要价值。

研究发现,肿瘤浸润淋巴细胞(tumor infiltrating lymphocytes,TILs)的结构和组织可以预测临床结果。

2018年,Saltz等使用CNN来检测和量化癌症基因
组图谱中图像中TIL的结构,发现该特征对13种不同癌症亚型的预后有预测作用。

Wang等也使用CNN开发了一种用于肿瘤病理学图像的自动肿瘤区域识别系统。

从确定的肿瘤区域,他们提取了22个明确的形状和边界特征,并且开发了一个预后
模型来预测患者的生存结果,发现基于肿瘤形状特征的肿瘤区域识别和风险评
分预测管道是一种客观的预后方法,为肿瘤形状与患者预后之间的关系提供了新
的见解。

Jaroensri等为乳腺癌诺丁汉评分系统的每个组件开发了单独的深度学习系统(deep learning system,DLS),分析了基于AI的肿瘤分级的预后价值,该
分析证明了与病理学家提供的肿瘤分级相当的预后价值,为基于人工智能的诺丁
汉分级系统提供了补充验证,并提供了一种改善乳腺癌分类和预后的潜在方法。

Arya等在堆叠的集成框架中使用一些基于DL的预测模型,以改善从可用的多模
态数据集中预测乳腺癌的预后。

第一阶段使用CNN进行特征提取,而第二阶段使
用提取的特征作为基于堆栈的集成模型的输入。

使用不同性能度量评估的预测性能表明,该模型比现有方法产生更好的结果,其准确率高达90.2%。

国内外已有多个研究团队利用深度学习技术进行乳腺癌预后预测的研究,并取得了显著的成果。

例如,某研究团队基于CNN算法构建了一个乳腺癌预后预测模型,该模型能够准确预测乳腺癌患者的复发和转移风险,为患者提供个性化的治疗方案和预后评估。

深度学习模型在乳腺癌预后预测中的准确性得到了大量数据的支持。

例如,某研究团队使用了来自多个医疗中心的乳腺癌患者数据作为训练集和测试集,通过对比深度学习模型与其他预测模型的预测结果,发现深度学习模型具有更高的预测精度和更低的误差率。

3.总结
人工智能深度学习在乳腺癌病理诊断中的研究进展显著,通过深度神经网络模型如CNN等,实现了对乳腺病理图像的自动分析和诊断,显著提高了诊断的准确率和效率。

深度学习技术可以辅助病理医生识别复杂病变,降低漏诊和误诊率。

本文主要总结了DL在乳腺癌病理诊断中从常规、术中冰冻快速组织病理学到组
织学分级、淋巴结转移诊断、分子分型免疫组化定量检测、分子病理学诊断、预测乳腺癌预后等的应用,此外,通过DL算法自动化评估病理图像的形态学特征,能为病理诊断提供更多有价值的信息,从而有可能取代一些昂贵的多基因检测来预
测乳腺癌的结果。

然而,目前面临数据标注困难、模型泛化能力有限等挑战,而
且将AI应用于病理诊断中的多个步骤仍需要人工辅助,还未实现完全自动化,并
且AI用于后续指导免疫治疗、靶向治疗等技术依旧处于未完善阶段。

即使人工智能技术应用于现代病理学存在一定的局限性,但基于DL人工智能方法在数字病理学方面依旧前景广阔。

如通过DL等算法探索免疫检查点抑制剂及其他新型免疫治疗靶点,这将更好地指导乳腺癌的靶向治疗、联合化疗以及预测预后复发风险等。

未来可结合多组学数据建立相关DL模型用于打造更加先进的精准医疗。

相关文档
最新文档