患者相似性的研究热点及文献计量可视化分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

VJP^I^TI^N^NEVIQEgHN^Yjg^iy
doi:l0.3969/j.issn.1672-5166.2021.02.027
患者相似性的研究热点及文献计量
可视化分析
许寒冰①相静①②△崔晓婕①
文章编号:1672-5166(2021)02-0285-07中图分类号:R-34;C195.1文献标志码:A
摘要目的利用文献计量分析方法探索患者相似性的研究热点领域。

方法使用VOSviewe「软件对检索库中有关患者相似性文献进行分析,分别从发文量、发文期刊、作者合著网络、热点研究领域等方面进行统计分析。

结果国际上患者相似性文献量整体呈上升趋势,发文量最多的国家为美国。

主要的热门研究领域有电子健康档案、疾病预测、相似性方法和精准医学,且随着个性化时代的到来,研究人员越来越关注精准医学领域。

结论近年来,患者相似性热点研究领域不断扩大,精准医学新兴研究热点突出,相似性研究方法趋于综合性。

关键词患者相似性文献计量分析VOSviewer
Research Hotspots of Patient Similarity and Visual Analysis of Bibliometric
XU Hanbing,XIANG Jing,CUI Xiaojie
School of Public Health and Management,Binzhou Medical University,Yantai264003,Shandong,China
Abstract Objective Using bibliometric analysis methods to explore the research hotspots of patient similarity.Methods VOSviewer software was used to analyze the patient similarity literature in the retrieval database,and conduct statistical analysis on the quantities of published articles,journals,author co­authorship network and hot research fields.Results The published articles of patient similarity in the world is on the rise,and the country with the largest amounts of publications is the United States.The main research areas are electronic health records,disease prediction,similarity measurement and precision medicine, and with the advent of the era of personalization,researchers are paying more and more attention to the field of precision medicine.Conclusion In recent years,the hotspots field of patient similarity researches have been continuously expanded,precision medicine as a new hotspot has become prominent,and the methods of similarity research tend to be more comprehensive.The United States and China have done a lot of raaaarch ip this area,and cooperation between authors and countries needs to be further strengthened.
Keywords patient similarity;bibliometric analysis;VOSviewer
基金顶目:中国博士后科学基金面上顶目《基于临床大数据的结直肠癌精准诊疗决策支持系统研究》(顶目编号:2017M612295);2020全
—以新冠肺炎为例》(顶目编号:国统计科学研究顶目一般项目《大数据背景下突发重大公共口生事件统计监测与预警研究—
2020LY079)
①滨州医学院公共卫生与管理学院,LB东省烟台市,264003
②LB东大学公共口生学院,山东省济南市,250000
作者简介:许寒冰(1995—),女,硕士;研究方向:流行病与卫生统计学;E-mail:152****************
通信作者:相静(1979—),女,博士,副教授;研究方向:大数据疾病风险评估与Wil;E-mail:*****************
△通信作者
285©
@中国卫生信息管理/C HIIIESEMlUIHMlllFHMmnifflHHIMmCSMmMMIMiEBIEIIT
随着卫生信息化的建设与发展,健康医疗大数据经加工处理后形成各种形式的大量信息,如何更好地利用这些数据是业界所关注的焦点⑴。

通过患者相似性分析,能够利用健康医疗数据实现对患者疾病的个性化预测,达到精准医疗的目的,具有极高的医疗价值和临床M SZ QI
患者相似性分析指在特定的医疗环境下,选取临床概念(如诊断、症状、检查检验、家族史、既往史、暴露环境、药物、手术等)作为患者的特征项,定量分析复杂概念语义空间中概念间的距离,从而动态地度量患者间的距离,筛选出与索引患者相似的患者相似组⑶。

通过患者相似性分析可以确定患者相似组,并从相似患者的医疗数据记录中获取相应的信息,以提供个性化预测,推荐个性化治疗方案⑴化目前,关于患者相似性分析的研究还处于探索阶段,本文使用文献计量分析工具VOSviewer 对检索到的患者相似性相关文献进行统计分析,以图表和知识图谱的方式展示该领域的研究热点及趋势,为相关学者提供参考。

1数据来源与方法
1.1文献数据来源与检索条件
要于Web of Science 核心合集数据库和PubMed,以主题词"patient similarity"作为检索条件,检索时间跨度为1985年1月1日至2020年4月27Ho从Web of Science中共检索到106篇文献,PubMed中共检索到78篇。

将所有文献导入Endnote进行合并筛选,删除重复、不相关文献后,共纳入103篇文献。

1.2统计分析
利用VOSviewer1.6.13和Excel2003软件分别从发文量趋势、发文期刊分布、作者分布及合作网络、热点研究领域、新型研究热点5个方面对文献进行分析。

2结果
2.1发文量趋势
从发文量趋势可以看出,关于患者相似性的文献最早发表于2006年的电气电子工程师学会模糊系统国际会议。

该研究提出了一种利用0WA (ordered weighted averaging,次序权重平均)算子计算患者相似度的新方法,同时使用模糊C-均值将患者聚类成一致的诊断组何。

2013年之前相关研究比较少,每年发文量都在5篇以内。

从2014年开始发文量逐渐增加,2019年达到24篇,与2018年相比增加9篇,增长较为迅速。

见图1。

年份
图1患者相似性研究发文量变化趋势(2006—2020年)
2.2发文期刊
103篇文献中36篇为会议论文,67篇为期刊论文。

按发文量由多到少排序,发文最多的期刊为Journal of Biomedical Informatics(7篇)和Studies in Health Technology and Informatics(7篇),发文3篇的期刊(或论文集)有5种,发文2篇的期刊(或论文集)有9种,见表1。

&286
XJlPPUCffTIONOFNEWTECHNOLOGYj^^应用
表1患者相似性文章期刊来源分布
序号期刊发文量/篇
1Journal of Biomedical Informatics7
2Studies in Health Technology and Informatics7
3BMC Medical Informatics and Decision Making3
4AMIA Joint Summits on Translational Science Proceedings3
5International Journal of Medical Informatics3
6JMIR Medical Informatics3
72014IEEE-Embs International Conference on Biomedical and Health Infonnatics3
82016IEEE16th International Conference on Data Mining2
9AMIA Annual Symposium Proceedings2
10Biology Direct2
11Conference of the IEEE Engineering in Medicine and Biology Society2
12Frontiers in Physiology2
13JACC Cardiovascular Imaging2
14Journal of Medical Systems2
15Proceedings of the7th Acm International Conference on Bioinfbrmatics,Computational
Biology,and Health Informatics
2 162015IEEE International Conference on Healthcare Informatics2
2.3作者分布及合作网络
在VOSviewer中对发文量2篇以上的作者进行作者合著分析。

403位作者中,发文量在2篇以上的作者有76人,其中发文量最多的作者为来自美国康涅狄格大学的Fei WANG(9篇),其主要研究领域是相似性度量方法[仁调和风险评估与预测冋;其次是来自美国康涅狄格大学的Jimeng SUN (7篇),主要研究领域是个性化预测[询和患者预后[15-16];然后是来自IBM中国研究院的Haifeng LIU(6篇),主要研究领域是临床决策支持[17-18]和风险识别问。

由作者机构所在国家可以看出美国和中国发文量较多,见表2。

(wei,L(wang,n.]
chen』.]
zhou,x.乙
zhang,r.s.
CZZJ
^xie-g J
(gu,c.]
wang,s.
(qian,b.y.]
〔gotZ'd」
图2作者合著网络图
hu,j.y.]
sun,j.m.
(wei,j.s.] [mei,j.]
[liu,h.]
[hu,j.:
28“
@中国卫生信息管理/湍》|觥J OURNiU OF HEAITH INFORWIimCS AND imAGEIMNT
表2高频作者分布
对76位作者进行合著网络分析,可以看出关联强度较大的23位作者形成5个合作团体,按人数由多到少依次为:以Jimeng SUN(sun,j,m)为主的团体共7人,以Haifeng LIU(liu,h}为主的团体共5人,以Shuang WANG(wang.s)为主的团体共5人,以Fei WANG(wang, f)为主的团体共4人,以Ni WANG(wan g.n)为主的团体共3人。

其中Fei WANG和Jimeng SUN两位作者来自同一机构,二者团体之间有过相关合作,见图2。

2.4热点研究领域分析
在VOSviewer中对出现2次以上的关键词进行关键词共现分析。

结果表明,454个关键词中一共有86个关键词出现频数超过2次。

其中前十位的关键词有患者相似性、人类、电子健康记录、医学信息学、计算机科学、分类、机器学习、临床决策支持系统、精准医学、数据挖掘,见表3。

表3高频关键词分布
序号关键词出现频次/次联系强度1Patient similarity(患者相似性)37117 2Humans(人类)1467 3Electronic health records(电子健康记录)1458 4Medical informatics(医学信息学)1354 5Computer science(计算机科学)1346 6Classification(分类)936 7Machine learning(机器学习)831 8Clinical Decision Support systems(临床决策支持系统)740 9Precision medicine(精准医学)727 10Data mining(数据挖掘)518
@288
\JWPLICATION OF NEW TECHNOLOGY新技术血电J
对86个关键词进行聚类形
成热点研究领域,选择“LinLog/
modularity"作为标准化方法,将最
小簇大小设置为5。

共形成5类热
点研究领域,每种颜色代表1个类别。

其中第1类(红色)主要关注于电子健康档案在患者相似性分析中的应用,第2类(绿色)主要关注于计算机科学在相似性研究中的应用,第3类(蓝色)主要关注于疾病诊断预测,第4类(黄色)主要关注于相似性方法研究,第5类(紫色)主要关注于精准医学,见图3。

通过关键词密度可视化图也可以看出,患者相似性相关分析热门领域主要有患者相似性方法研究、电子健康记录、医学信息学和精准医学,见图4。

2.5新型研究热点分析
在VOSviewer中,使用map file文件里的得分和颜色字段赋予节点不同的颜色,其中得分设置为关键词平均年份,颜色设置为彩虹色。

按关键词的平均年份取值进行颜色映射,得到关键词时间分布网络图,见图5。

2014—2016年之间关键词出现次数较多的有算法、聚类分析、机器学习等,从2017年开始关键词出现次数较多的有医学信息学、精准医学、基因、预测等。

3讨论
3.1患者相似性热点研究领域不
断扩大
2013年之前,国际上患者相似性的相关研究较少,研究热点主要
iniques
rpretation exp(
Jter interface risk pati^t subsets
map<Bduce
jlstudies
ajfccal data min ing bioph^mlstry8j®nok
、electronic r^ical recofes^kSta^^upp<^t
9network similaril^search-
dise^e predictions
bi*ata prognosis
personaThMiTTedicine-
pati赢s fore^thiA
卩^少me些ine
patient similarity
temporal sequer
prediction
hea.are
ne*>Fks
图3关键词共现分布网络图
图4关键词密度可视化图
hepatic*!
classification
A
审s sment impact g昭e
b^logy
explosion
computer si
interpretation model
system
Z^gPfdreGagting,
patients
physical
medicine
pbecisib电#edicin&
bl^pst ri^k topolo^l data anal典—-
medical inform^tic/
】.healtfrtare scienceSfflKrvice一<^|cer
旳9°diagsiS、C叫|『1企3
営;:
electronic health reqoi^b
patens
mutations r
j frarn超vork
巧船吨electronic radical records,
SUI^Val er^kering
network
studies
.创data min ing bioph^rnistry妨16le.a r biol o__
genome
pre^ption
母矗可二heal»are
tad£^pcjation/net^Jfks-
吋nW—層
竺。

呷乡嗽哼_亠孝赫§粵::;
_e^l re»lA?vdl
critical care
traditio厲Chinese medicine mapreduce
20142015 20162017 20182019
图5关键词时间分布网路图
289©
@中国卫生信息管理/湍》|觥J OURNiU OF HEAITH INFORWIimCS AND imAGEIMNT
是相似性算法等理论研究。

从2014年开始,电子健康档案逐渐成为患者相似性分析的数据来源,患者相似性分析开始应用于个性化预测、疾病诊断等各个领域。

通过利用患者的诊断资料、检查检验数据、人口统计学信息、影像学资料等,可以辅助医生进行疾病诊断、治疗方案推荐,以及疾病预测。

同时,随着基因组学的发展,患者相似性分析也开始应用于精准医学等研究领域。

国内相关研究尚处于探索阶段,研究热点基本是从理论向应用不断扩展,目前相关应用研究仍较少,且集中于个性化治疗和疾病预测。

例如,黄艳群等人将患者相似性应用于糖尿病患者,建立糖尿病患者的个性化预测模型画;陈婕卿等人将患者相似性应用于艾滋病患者,通过探讨艾滋病患者的相似性为制定个性化治疗方案提供依据叫
3.2精准医学新兴研究热点突出
患者相似性在不同领域的新兴研究热点不断出现,最近的研究热点是精准医学。

精准医学是依据患者内在生物学信息以及临床症状和体征,把不同的患者个体进行分类,并区别性地选择或改变治疗方案四。

随着人工智能和人类基因组学的发展,患者相似性也将在电子健康档案的基础上,整合并利用人类基因组及相关系列技术的研究数据,将相似性研究应用于精准医学领域。

例如:PAI等人应用一种基于患者相似性网络的新型监督患者分类框架netDx,根据患者的基因组数据实现了不同癌症患者的分类曲。

随着健康医疗大数据的发展,病例数据、影像学资料,以及基因组学资料不断增多,未来将有越来越多的医疗数据被应用于更多领域,并通过进一步融合形成新的研究热点。

3.3相似性研究方法趋于综合性
患者相似性研究方法不断更新,并且随着电子健康档案的发展,一些机器学习以及聚类算法也被用于相似性研究。

计算患者间的相似性是患者相似性分析中的重要环节,常用的相似性度量方法是距离度量方法,如Jaccard系数、余弦相似度、欧式距离等。

而由于健康医疗数据复杂多样,往往需要采用多种方法进行综合计算分析。

HUANG等人提出了一种基于欧氏距离和Jaccard系数的患者相似性度量方法来建立糖尿病预测模型,该模型比用单一的欧氏距离建立的预测模型具有更高的性能,这表明在进行实际预测时需要采用一个综合的相似性度量方案[24l o王妮等人对数据类型多样的电子病历数据开展了基于半监督学习的患者相似性度量研究,与基于传统欧氏距离和余弦距离的结果进行比较,结果显示基于半监督学习的患者相似性度量研究是有效的[5l o
3.4作者机构间合作有待加强
各个作者集群间均有合作,已形成5个较为密切的合作团体。

在不同机构和国家间已出现较多合作,但作者间的合作主要集中于研究机构内部,不同研究机构、不同研究背景下的研究合作较少。

患者相似性是一种涉及多学科多领域的交叉研究成果,不同领域间的合作研究及多学科的融合更利于推动其发展。

同时在健康医疗大数据背景下,多机构的合作与资料共享能更好地促进患者相似性理论方法及应用的发展。

无论在理论研究还是应用研究方面,期望未来能形成深入广泛的交流合作,优化配置研究资源,促进成果交流,将患者相似性应用推广于更多研究领域。

4结语
患者相似性分析能有效地利用医疗数据进行疾病预测等研究,具有很高的医疗价值和临床意义。

本文通过热点研究发现,近年来患者相似性应用领域不断扩大,相关研究方法不断更新。

患者相似性研究是一种新兴的交叉领域研究,需要加强不同领域研究人员之间的合作与交流,共同促进患者相似性研究的拓展,进一步促进卫生信息化的发展。


[1]相静,王玖,胡西厚.健康医疗大数据驱动下的疾病风险评估与预测方法探析[J].中国卫生信息管理杂志,2018, 15(3):329-333.
@290
[2]PAI S,BADER G D.Patient Similarity Networks for
Precision Medicine卩].Journal of molecular biology,2018, 430(18):2924-293&
⑶贾峥,宗瑞杰,段会龙,等-基于电子病历的患者相似性
分析综述[J].中国生物医学工程学报,2018,37(3):353-366.
[4]SHARAFODDINI A,DUBIN J A,LEE J.Patient Similarity
in Prediction Models Based on Health Data:A Scoping Review[J],JMIR Medical Informatics,2017,5(1):e7.
[5]王妮,黄艳群,刘红蕾,等.基于半监督学习的患者相似
性度量研究[J].北京生物医学工程,2020,39(2):152-157.
[6]许寒冰,王建,李新征,等.基于VOSviewer的当代大学
生就业心理可视化分析[J].卫生职业教育,2019,37(22): 41-45.
[7]高亚,魏巍,罗鑫悦,等.单个病例数据Meta分析弓I用情
况研究[J].中国药物评价,2019,36(5):330-335.
[8]高亚,李沐阳,孙月,等.证据图研究合作能力与研究主
题分析[J].中国药物评价,2019,36(3):165-16&
[9]LIANG Y D,LI乂ZHAO J,et al.Study of acupuncture for
low back pain in recent20years:a bibliometric analysis via CiteSpace[J].J Pain Res,2017,10:951-964.
[10]POPESCU M,KELLER J M.Summarization of Patient
Groups Using the Fuzzy C-Means and Ontology Similarity Measures[C]//IEEE International Conference on Fuzzy Systems,New York:IEEE,2006:534-539.
[11]WANG F,SUN J.PSF:A Unified Patient Similarity
Evaluation Framework Through Metric Learning With Weak Supervision^].IEEE J Biomed Health Inform,2015,19(3): 1053-1060.
[12]WANG F.Adaptive semi-supervised recursive tree
partitioning:The ART towards large scale patient indexing in personalized healthcare[J].Journal of Biomedical Informatics, 2015,55:41-54.
[13]WANG X,WANG F,WANG J,et al.Exploring Patient
Risk Groups with Incomplete Knowledge[C]//IEEE13th International Conference on Data Mining,New York:IEEE, 2013:1223-1228.[14]NG K,SUN J,HU J,et al.Personalized Predictive Modeling
and Risk Factor Identification using Patient Similarity[J].
AMIA Jt Summits Transl Sci Proc.2015,25:132-136. [15]EBADOLLAHI S,SUN J,GOTZ D,et al.Predicting
Patient's Trajectory of Physiological Data using Temporal Trends in Similar Patients:A System for Near-Term Prognostics[C]//Amia Annu Symp Proc,2010:192-196. [16]WANG F,HU J,SUN J.Medical prognosis based on patient
similarity and expert feedback[C]//Proceedings of the21st International Conference on Pattern Recognition,New York: IEEE,2013.
[17]MEI J,LIU H,LI X,et al.Outcome-driven Evaluation
Metrics for Treatment Recommendation Systems[J].Studies in Health Technology Informatics,2015(210):190-194. [18]LIU H,XIE G,MEI J,et al.An efficacy driven approach
for medication recommendation in type2diabetes treatment using data mining techniques]」].Studies in Health Technology Informatics,2012,192:1071-1071.
[19]LIU H,LI X,XIE G,et al.Precision Cohort Finding
with Outcome-Driven Similarity Analytics:A Case Study of Patients with Atrial FibrillationfJ].Studies in Health Technology Informatics,2017,245:491-495.
[20]黄艳群,王妮,张慧,等.利用患者相似性建立个性化糖
尿病预测模型[J].医学信息学杂志,2019,40(1):54-58. [21]陈婕卿,杨秋英,陈卉,等.基于案例推理在艾滋病患者
个性化治疗方案推荐中的应用[J].北京生物医学工程,2017,36(1):16-20.
[22]焦怡琳,王吉春,张群,等.中国在精准医学领域面临的
机遇与挑战[JJ.中国公共卫生管理,2015(5):601-603. [23]PAI S,HUI S,ISSERLIN R,et Dx:interpretable patient
classification using integrated patient similarity networks卩].
Molecular Systems Biology,2019,15(3):e8497.
[24]HUANG Y,WANG N,LIU H L,et al.Study on Patient
Sim P arity Measurement Based on Electronic Medical Records[J].S tudies in Health Technology Informatics,2019, 264:1484-1485.
[收稿日期:2020-10-11修回日期:2021-03-16]
(编辑:耿俊超)
29"。

相关文档
最新文档