耳鼻喉科专病大数据平台的设计与实践

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文章编号:1672-5166(2021)03-0405-07 中图分类号:R-39;R319 文献标志码:A
摘 要 目的 解决目前科室医生在临床科研分析中所面临的患者全病程数据缺乏标准治理,难以挖掘专病大数据的潜在价值,无法产出高质量科研成果的问题。

方法 研发基于机器学习的耳鼻喉科专病科研大数据平台,对科室临床数据进行科研粒度级别的采集与治理。

对筛选出的甲状腺疾病临床样本进行建模分析,选择出最优机器学习算法进行诊断预测。

结果 医生通过平台可以快速利用临床数据,自助构建机器学习模型,并将其应用于科研分析和辅助诊疗中。

结论 实现了耳鼻喉科专科临床数据采集、整合、治理、分析和挖掘的一体化,提升了科室临床综合水平。

关键词 专病大数据 机器学习 临床科研 耳鼻喉科
Design and Practice of the Specialized Diseases Big Data Platform for Otolaryngology Department Based on Machine Learning
DAI Jingjuan, HU Ping, CHEN Mingyang, HUANG Xiaoqin
Ningbo Medical Center Lihuili Hospital, Ningbo 315040, Zhejiang, China
Abstract Objective In order to solve the current problems faced by doctors in the department of clinical scientific research and analysis, including a lack of standard management of the whole disease course data of patients, difficult to explore the potential value of big data for specific disease, and hard to produce high-quality scientific research results. Methods A big data platform for otolaryngology special research based on machine learning was developed to collect and manage clinical data of departments at the granularity level of scientific research. Moreover, the selected clinical samples of thyroid diseases were modeled and analyzed. Finally, the optimal machine learning algorithm was selected for diagnosis and prediction.
Results The platform enables doctors to quickly utilize clinical data, self-help machine learning model and apply it in scientific research analysis and auxiliary diagnosis and treatment. Conclusion It has realized the integration of clinical data collection, integration, management, analysis and mining in otolaryngology department, and improved the clinical comprehensive level of the department.
Keywords specialized diseases big data; machine learning; clinical research; otolaryngology
课题项目:浙江省医药卫生科技计划项目《基于大数据的智能临床决策分析平台研究》(项目编号:2019KY187)
①宁波市医疗中心李惠利医院,浙江省宁波市,315040
②万达信息股份有限公司,上海市,200040
作者简介:戴静娟(1971—),女,本科,信息科主任,高级工程师;研究方向:医院信息化管理;E-mail:
通信作者:胡萍(1971—),女,本科,绩效办主任,高级会计师;研究方向:数据分析;E-mail:
△通信作者
405
Chinese Journal of Health Informatics and Management, Jun. 2021, Vol.18, No.3 中国卫生信息管理杂志2021年6月第18卷第3期
APPLICATION OF NEW TECHNOLOGY 新技术应用
409
2.3 数据特征选择
通过特征选择算子,将队列样本数据分为2类:特征列数据和标签(目标)列数据。

队列样本的特征列有7类:Age、Sex、TSH、T3、TT4、T4U、FTI。

Label 为标签列,即最终算法模型需要预测的目标列。

2.4 机器学习模型训练与结果 
评估
该平台针对分类问题提供了5种机器学习算法:K 近邻、随机森林、极限森林、支持向量机和朴素贝叶斯。

调用机器学习分类模型训练算子,依次选择上述机器学习算法,并输入特征列与标签列,进行机器学习模型训练。

在模型训练过程中,平台默认使用K 折交叉验证(K=5),以防止最终模型发生过拟合或欠拟合。

训练后得到模型评估指标平均得分。

通过可视化形式比较不同算法的预测结果,找到最优预测模型。

针对经过数据特征选择后得到的甲状腺疾病科研队列,选择5种机器学习算法进行训练并比较评价结果,见表4、图5。

比较5种机器学习分类算法得到的评估结果,可以看出K 近邻模型、随机森林模型和极限森林模型在精准率和召回率上都达到了90%左右甚至更高,并且其模型的曲线下面积(AUC)也都达到0.95及以上,ROC 曲线与45°线的偏离也较大。

所以,可以认为这3种模型均有较好的预测效果,可以根据临
床指标较好地预测患者是否患有甲状腺疾病。

2.5 模型辅助预测
通过模型训练得到了3种算法模型,选择其中一种随机森林模型,将其命名为“甲状腺疾病诊断分类模型”,保存并发布至耳鼻喉科科研专病库系统。

通过后台实
表4 甲状腺疾病分类预测模型报告
模型名称精确率
召回率F1值K 近邻
甲状腺患病0.910.880.90甲状腺未患病0.990.990.99准确率——0.98宏平均0.950.930.94加权平均0.980.980.98随机森林甲状腺患病0.99 1.000.99甲状腺未患病 1.00 1.00 1.00准确率—— 1.00宏平均0.99 1.00 1.00加权平均 1.00 1.00 1.00极限森林甲状腺患病0.990.970.98甲状腺未患病 1.00 1.00 1.00准确率—— 1.00宏平均0.990.990.99加权平均 1.00 1.00 1.00支持向量机甲状腺患病0.99 1.000.99甲状腺未患病 1.00 1.00 1.00准确率—— 1.00宏平均0.99 1.00 1.00加权平均 1.00 1.00 1.00朴素贝叶斯甲状腺患病0.440.900.59甲状腺未患病0.990.880.93准确率——0.89宏平均0.720.890.76加权平均
0.94
0.89
0.90
时监控新增入库记录中患者的年龄、性别等基本信息和TSH、T3、TT4、FTI 这几项临床指标,即时利用该模型进行疾病的预测分类。

如果预测结果为“患有甲状腺疾病”则自动向医生发出警告提示,并将患者纳入重点观察对象,再结合患者的临床特征及相关指标进一步判断出具体的甲状腺疾病种类,如甲
Chinese Journal of Health Informatics and Management, Jun. 2021, Vol.18, No.3 中国卫生信息管理杂志2021年6月第18卷第3期
APPLICATION OF NEW TECHNOLOGY 新技术应用
425
本文提出并建设基于细粒度跨域安全访问技术的云资源管理系统。

该系统不仅可以有效提高系统运维工作的质量,而且还借助细粒度的跨域云服务接入功能,将来自39所市级医院的虚拟化资源集中统一运维和管理,从而大幅提高了工作效率,也为各级医院的设备管理工作提供了一种新的借鉴方式。

将来希望通过人工智能技术优化系统功能,提高对设备信息的分析和学习能力,从而更好地帮助运维人员做好系统管理工作。


参考文献
[1] AIJING L, JIN Y, ALI M I. Design of the Hospital
Integrated Information Management System Based on Cloud Platform[J]. The West Indian medical journal, 2016, 64(5):521-526.
[2] LI C, TANG J, LUO Y. Elastic edge cloud resource
management based on horizontal and vertical scaling[J]. The Journal of Supercomputing, 2020, 76(1):7707-7732.
[3] AlI S A, ANSARI M, ALAM M. Resource Management
Techniques for Cloud-Based IoT Environment[M]. ALAM M, SHAKIL K, KHAN S. Internet of Things (IoT). Cham: Springer, 2019.
[4] 王铸, 金祝华.医疗设备管理系统架构与功能设计[J]. 信
息记录材料, 2020, 21(2):203-204.
[5] 李泽宇, 何萍, 朱立峰.面向物联网+RFID 技术的设备管
理系统研究与应用[J].中国数字医学, 2019, 14(11):54-56, 53.
[6] 周伟, 董青, 周作建, 等. 基于智能终端设备的健康管
理信息平台架构设计[J]. 中国卫生信息管理杂志, 2015, 12(1):49-54.
[7] 于强, 廖晓斌, 林建斌. 基于Web 的现代医疗设备管理系
统的研制[J]. 中国医疗器械杂志, 2017, 41(1):70-72.[8] 何萍, 高解春, 于广军, 等.上海市级医院临床信息交
换共享平台建设与应用[J]. 中华医院管理杂志, 2015, 31(8):596-598.
[9] 何萍. 医联工程:架起健康的彩虹桥[J]. 上海信息化,
2015,12(4):50-53.
[10] 周奇才, 王奕童, 赵炯, 等. 基于RBAC 模型的细粒度权
限管理系统的设计与实现[J]. 网络安全技术与应用, 2019, 19(10):38-41.
[11] 黄良强, 朱焱, 陶霄. 基于HBase 的细粒度访问控制方法
研究[J]. 计算机应用研究, 2020, 37(3):190-194.
[12] 余杨奎. 基于角色的访问控制模型(RBAC)研究[J]. 计算
机技术与发展, 2019, 29(1):198-201.
[13] 黄美蓉, 欧博, 何思源. 一种基于特征提取的访问控制方
法[J]. 计算机科学, 2019, 46(2):118-123.
[14] ZHANG X, OH S, SANDHU R. PBDM: A Flexible
Delegation Model in RBAC[J]. DBLP, 2016, 32(3):149-157.[15] 郁宁, 王高才. 基于可信期望的跨域访问安全性研究[J].
计算机应用研究, 2020, 37(11):212-216, 222.
[16] 徐学东, 张志俊. 基于信任计算的跨域访问控制研究[J].
电子制作, 2016,23(20):49-50.
[17] 苏玮, 尹晓. 智慧社区中的跨域访问控制模型研究[J]. 智
能建筑与城市信息, 2016,23(11):64-68.
[收稿日期:2020-03-11 修回日期:2020-09-15]
(编辑:耿俊超)
[15] 陈轶. 机器学习技术在医疗数
据挖掘中的应用[J]. 电子测试, 2015,22(3):93-95.
[16] 李桃, 蒋伏松, 陈霆, 等. 预测2型
糖尿病并发颈动脉斑块的机器学习模型的建立[J]. 医疗卫生装备,
2020, 41(1):7-11, 24.
[17] 葛皓昀. 基于机器学习的肝
炎预测与研究[J]. 电子制作, 2019,26(6):62-64.
[18] 韩温, 冈倪, 鲁慧, 等. 基于健康
医疗大数据的智能辅助诊断系
(上接第410页)
统研究[J]. 中国卫生产业, 2020, 17(10):159-161.
[收稿日期:2020-11-27修回日期:2021-03-13]
(编辑:耿俊超)。

相关文档
最新文档