基于字词融合与对抗训练的医疗对话实体识别

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于字词融合与对抗训练的医疗对话实体识别
田海强;汪济洲;徐海珍;孔维哲
【期刊名称】《黑龙江工业学院学报(综合版)》
【年(卷),期】2024(24)2
【摘要】针对BERT-BiLSTM-CRF在中文医疗对话实体识别过程中存在字词边界特征获取不充分、实体边界语义泛化能力弱和复杂实体嵌套识别准确率较差等问题,提出了一种基于字词融合与对抗训练的医疗对话实体识别模型。

首先,引入外部词汇匹配句中字符对应的字词特征,通过词汇适配器(Lexicon Adapter,LA)集成到BERT模型内部形成字词融合向量,加入对抗训练(Projected Gradient Descent,PGD)生成对抗样本;其次,将字词融合向量与对抗样本作为训练数据传入双向门控循环单元(Bidirectional Gated Recurrent Unit,BiGRU)提取上下文语义信息;最后,用条件随机场(Conditional Random Field,CRF)最终解码,在IMCS21中文医疗对话数据集上实验表明,模型的F1值达到92.06%。

相较于BERT-BiLSTM-CRF模型,有效提高了复杂语义的实体理解和标签识别精度。

【总页数】8页(P77-84)
【作者】田海强;汪济洲;徐海珍;孔维哲
【作者单位】合肥大学先进制造工程学院;安徽大学人工智能学院
【正文语种】中文
【中图分类】TP391.1;R-05
【相关文献】
1.基于字词联合训练的Bi-LSTM中文电子病历命名实体识别
2.融合嵌入字词特征的中文医疗命名实体识别
3.基于RoBERTa和对抗训练的中文医疗命名实体识别
4.基于字词融合与对抗训练的行业人物实体识别
5.基于RoBERTa与字词融合的电子病历命名实体识别方法研究
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档