织物整理专业术语词义消歧与热点趋势研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

织物整理专业术语词义消歧与热点趋势研究
Abstract:Fabric finishing,including chemical and mechanical processing methods,is a typical field of interdisci⁃
plinary integration.However,there are diversified expressions of professional terms and nonstandard words,which cause in⁃convenience and difficulties to document retrieval and academic hotspot analysis.More than 200000academic papers in 38journals in the textile field included in China CNKI were collected,and 25691papers with the CLC number of TS19(dyeing and finishing industry)were screened out.In combination with the latest edition of the textile dictionary Textile dic⁃tionary ,Textile Chinese Thesaurus ,Encyclopedia of textiles ,the original keywords of the papers and the professional terms
in the title and abstract,the professional terms related to the textile finishing field were sorted out bined
with big data analysis and expert comparison,word sense disambiguation was carried out for the phenomenon of “one mean⁃ing and many words ”,and 89professional terms in the textile finishing field including time attribute tags were obtained.This makes it possible to further study the hot spot changes and development trends of fabric finishing technology.Through the sudden detection technology and visual analysis of bibliometrics,it is found that hydrophobic finishing,fla ⁃Research on word sense disambiguation and
hot trend of textile finishing terms
收稿日期:2022-09-13作者简介:李启正,男,副编审,E-mail :******************.cn 。

胡崴琳(1998—),男,硕士在读。

李启正1,胡崴琳2,王成龙3
[1.浙江理工大学杂志社,浙江杭州
310018;2.浙江理工大学纺织材料与工程学院(国际丝绸学院),浙江杭州
310018;3.浙江理工大学先进纺织材料与制备技术教育部重点实验室,浙江杭州
310018]
LI Qizheng 1,HU Weilin 2,WANG Chenglong 3
[1.Periodicals Agency of Zhejiang Sci-Tech University,Hangzhou 310018,China;2.College of Textile Science and
Engineering (International Institute of Silk),Zhejiang Sci-Tech University,Hangzhou 310018,China;
3.Key Laboratory of Advanced Textile Materials and Manufacturing Technology,
Zhejiang Sci-Tech University,Hangzhou 310018,China]
摘要:织物整理包括化学和机械等多种加工方法,
是学科交叉融合的一个典型领域,但存在专业术语表达多样化、用词不规范等现象,给文献检索及学术热点分析造成不便和困难。

研究收集了38本中国知网收录的纺织领域期刊论文20余万篇,筛选中图分类号为TS19(染整工业)的论文25691篇,结合最新版《纺织词典》《纺织汉语叙词表》《纺织大百科》以及论文原有关键词、题目和摘要中出现的专业术语,梳理出织物整理领域相关专业术语122个。

结合大数据分析和专家比对,对“一义多词”现象进行词义消歧,得到包含时间属性标签的89个织物整理领域专业术语。

为进一步研究织物整理技术的热点变化和趋势发展提供了可能,通过文献计量学的突发检测技术和可视化分析发现,疏水整理、阻燃整理、拒水整理、抗菌整理和防紫外线整理为近年织物整理领域的新兴热点,且相关论文是国家级课题论文的概率更高。

研究结果可以帮助研究人员、专业期刊和数据库规范专业术语表达,实现语义检索和学术热点分析。

关键词:织物整理;
词义消歧;一义多词;突发检测;学术热点中图分类号:TS193.5文献标志码:A 文章编号:1005-9350
(2023)05-0006-05染整技术
Textile Dyeing and Finishing Journal
Vol.45No.5May 2023
第45卷第5期2023年5月
5期
织物整理简称“整理”,指除前处理、染色和印花以外的,改善织物外观、手感、尺寸稳定性以及增进或赋予织物某种功能的加工。

按术语语义可以分为两类:具有明确目的的整理术语(例如阻燃整理,目的是提高织物的阻燃性能)和不具备明确目的的整理术语(例如有机硅整理),本研究的研究范围是具有明确整理目的的术语。

按术语使用场景可以分为两类:学术论文中常出现的具有科学研究价值的整理术语和在实际生产中常出现的整理术语,本研究的研究范围是学术论文中常出现的具有科学研究价值的整理术语;还有部分术语分析价值较低,如涵盖范围广的整理术语(如化学整理)、出现频次过低的整理术语(如仿桃皮绒整理),本研究暂不予考虑。

整理术语一义多词现象严重,这严重影响了以词语频率为基础的学术热点分析,表达统一的整理术语(阻燃整理)相较于表达不统一的整理术语(防皱整理和抗皱整理)更容易成为学术热点,本研究的目的是在语义消歧的基础上分析现有织物整理领域学术热点并通过突发检测算法对织物整理领域未来学术热点进行预测,为织物整理领域的研究人员提供更加精确的学术热点分析。

1织物整理术语表述情况研究
1.1数据收集
本研究收集了中国知网发布的中国学术期刊影响因子年报(2021年版)中被分类为纺织(TS1)的37本期刊加上《染整技术》(中国知网WCJI纺织类收录)共200829篇论文的题目、关键词和摘要等数据,并根据中图分类号TS19(染整工业)筛选出25691篇论文进行数据分析。

论文起始年份为1994年(中国知网收录的论文1994年起才有中图分类号),截止时间为2021年12月31日。

1.2构建术语表
为了尽可能多地收集现有的织物整理术语,本研究首先收集纺织领域已有的词表:《纺织词典》(2007年版为最新版)、《纺织汉语叙词表》(1989年版
为最新版)、《纺织大百科》(2008年版为最新版),并对词表中的术语在学术论文中出现的情况进行分析。

本研究统计以上4个词典去重后共有26431个词,其中从未出现在《中国学术期刊影响因子年报(2021年版)》中被分类为纺织(TS1)的37本期刊中的词语有11669个(占44.1%),出现10次(包含)以上的有9124个(占34.5%)。

结果表明,现有词表的构建以专家选取的方式为主,基本上不考虑词语在纺织中文学术论文中出现的情况,所以建议在更新领域内术语时考虑术语的使用价值(词频)。

本研究对纺织现有词表中词频大于等于10次的9124个术语进行进一步的清洗,删除存在表述问题、领域问题和无意义词汇1463个,保留7661个术语。

考虑到纺织现有词表里的词语在学术论文中出现的比例较低,从学术论文题目、关键词和摘要中抽取名词性术语对词表进行补充,得到10219个术语,加上纺织词表中保留的7661个术语,共得到17880个术语,其中整理领域术语334个。

征询领域内专家意见后,保留具有直接目的的整理术语(如阻燃整理),去除偏向于过程的整理术语(如有机硅整理),去除泛化性的织物整理术语(如化学整理),共得到整理术语122个并计算在200829篇论文的题目、关键词和摘要中出现的次数。

1.3织物整理术语消歧与清洗
通过专家的鉴别,整理了以下术语一义多词的现象,在词义消歧的基础上共得到89个整理术语,一义多词的整理术语情况如表1所示。

本研究统计了每种表达在20万篇论文题目、关键词和摘要中出现的频次,规范术语是指在最新版的《纺织词典》《纺织汉语叙词表》《纺织大百科》、国家现行标准GB/T25799—2010《纺织染整助剂名词术语》中出现的规范表达。

相较于纺织领域其他研究领域术语,整理术语表达方式更为多样,在表述上不仅存在共同的问题:简称问题(超级柔软整理与超柔软整理)、一义多词问题(芳香整理与香味整理)、不规范表述(抗菌整理与抗菌卫生整理),还存在特有术语前缀(抗和防)的混
me retardant finishing,water repellent finishing,antibacterial finishing and UV resistant finishing are emerging hot spots in the field of fabric finishing in recent years,and the probability of relevant papers being national subject papers is higher. This study can help researchers professional journals and databases standardize the expression of professional terms to achieve semantic retrieval and academic hotspot analysis.
Key words:fabric finishing;word sense disambiguation;one meaning and many words;burst detection;academic hotspot
李启正,等:织物整理专业术语词义消歧与热点趋势研究7
染整技术45卷
用问题(抗皱整理和防皱整理)。

同时本研究发现,在词典或者国家标准中的织物整理术语,更习惯用“防”作为前缀(防紫外线整理、防皱整理、防起毛整理/防起球整理、防静电整理、防泛黄整理),但是在学术论文中,作者更习惯用“抗”作为前缀(抗紫外线整理、抗皱整理、抗起毛起球整理、抗静电整理、抗黄变整理),所以建议在修著整理术语时,应考虑作者的用词习惯。

2研究现状
2.1学术热点挖掘
学术热点挖掘主要有两种方法:基于引文网络的方法和基于文本挖掘的方法。

相较于基于引文网络的方法,基于文本挖掘方法的学术热点挖掘具有更好的可视化效果并且对变化更为敏感,基于文本挖掘方法的学术热点挖掘主要分为词语级和主题级两个层级。

词语级学术热点挖掘通常使用共词分析法或词频分析法。

共词分析法通过词语间共现关系展示研究主题的发展脉络和知识结构,词频分析法通过词语出现频次及其变化展现研究主题的兴衰,突发检测是词频分析法的主流方法之一[1]。

突发检测技术由Kleinberg等[2]在2002年首次提出,最开始的目的是自动检测大量电子邮件中出现频次比例突然增加的词语,为了保证检测的有效性,通常需要事先对词语进行规范化并明确检测词语的范围,为了避免因为词频比例在短期的剧烈变化导致多次伪突发,突发检测技术对词频变化较迟钝,只有当词频比例时间曲线斜率变化到一定程度时,才会出现状态的改变(处于突发状态和不处于突发状态)。

突发检测技术被广泛应用到各个领域,如通过突发检测技术分析文献中新型冠状病毒热点治疗药物,为药物研发提供方向指导[3];通过突发检测进行
序号1 2
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
同义词(出现频次)
抗紫外线整理(206),防紫外线整理(164),抗紫外整理(117),
防紫外整理(55),紫外线防护整理(27)
阻燃整理(1466),阻燃处理(87),防火整理(28)
抗皱整理(776),防皱整理(708)
无甲醛防皱整理(50),无甲醛抗皱整理(46)
抗静电整理(300),抗静电处理(28),防静电整理(16)
防缩整理(283),防缩处理(108)
呢毯整理(39),机械预缩整理(10)
防毡缩整理(243),防毡缩处理(42)
抗菌整理(1113),抗菌卫生整理(41),抑菌整理(11)
拒油整理(275),防油整理(110)
芳香整理(121),香味整理(28)
自清洁整理(44),超疏水整理(32)
抗起毛起球整理(166),防起毛起球整理(15)
抗静电处理(28),防静电整理(16)
亲水整理(237),亲水性整理(23)
柔软整理(812),柔软处理(152)
超级柔软整理(24),超柔软整理(22)
返旧整理(24),仿旧整理(13)
防蛀整理(21),防蛀处理(13)
防蚊整理(64),驱蚊整理(37),防蚊虫整理(21)
防臭整理(120),除臭整理(21)
频次最高表达
抗紫外线整理
阻燃整理
抗皱整理
无甲醛防皱整理
抗静电整理
防缩整理
呢毯整理
防毡缩整理
抗菌整理
拒油整理
芳香整理
自清洁整理
抗起毛起球整理
抗静电处理
亲水整理
柔软整理
超级柔软整理
返旧整理
防蛀整理
防蚊整理
防臭整理
规范术语
防紫外线整理
阻燃整理
防皱整理
抗静电整理
防缩整理
呢毯整理
防毡缩整理
抗菌整理/抑菌整理
拒油整理
香味整理
防起(毛)球整理
防静电整理
亲水整理
柔软整理
超柔软整理
防蛀整理
表1整理术语一义多词情况统计
8
5期
舆情监测,对微博话题进行跟踪和传播预测[4];通过突发检测技术挖掘学科领域内作者发文量变化,挖掘学术新星[5]。

2.2中国知网学术热点(整理领域)
中国知网首页中研究学习平台模块提供学术热点服务,纺织属于工程科技Ⅰ辑类下轻工业手工业
类目,热点主题的论文范围是属于中国知网分类下轻工业手工业期刊最近发表的4万篇论文。

检索日期是2022年7月13日,轻工业手工业热点共765个,通过专家判定从中筛选出107个纺织领域热点主题,其中织物整理领域主题共有5个,如图1
所示。

图1织物整理领域学术热点(由中国知网提供)
中国知网提供的学术热点具有一定的参考价值,但是不管从整个纺织领域还是织物整理领域分析,中国知网学术热点分析还存在以下4个不足之处:(1)从分类的角度分析,中国知网对于学科领域的分类还过于粗糙,纺织领域被分到轻工业手工业领域中,纺织领域热点主题和其他轻工业手工业热点主题混在一起,即使可以通过检索得到特定的小领域,但是基于字符串匹配的检索会忽略检索词的同义词,如当检索抗皱整理会提示没有检索到符合条件的结果。

(2)从热点主题表达的角度分析,中国知网通过主要知识点的前3个词语定义热点主题,主题关键词的自动选取会产生主题重合现象,如热点主题2和3都以整理剂作为关键词,类似的现象在纺织领域学术热点中也很常见,这影响了热点主题和热点主题之间边界的判断,直接影响热度值判断的准确性。

(3)从主要知识点关键词选取的角度分析,关键词并没有经过专业领域专家的核对和筛选,除了出现如应用、研究等无意义关键词,还出现不符合主题的知识点关键词如在热点主题1(棉织物、防皱整理、纳米
材料)知识点出现涂料印花。

(4)从热度值计算的角度分析,热度值计算方法存在不透明的情况,在整个纺织领域的学术热点中,出现了主要文献数、相关国家课题数、主要研究人员数和主要研究机构数都较多但是主题热度值低的现象。

3织物整理术语可视化分析
3.1
学术热点
在对整理术语规范化(将词典中出现的术语表达作为术语的正规表达,未在词典中出现的术语以出现最高频次的表达作为正规表达)和语义消歧(合并同义术语)的基础上,提取了题目、关键词或者摘要中出现89个整理术语的论文5931篇,选取发表时间最晚的5%论文,共296篇对整理术语进行热度分析,并统计主要论文数、主要作者数、主要机构数、国家课题论文数和占比,具体见表2。

阻燃整理是研究论文最多的主题,防皱整理的研究数排名靠前和中国知网整理领域的热点分析相符,相对于中国知网提供的学术热点分析服务,本研究在构建术语表的
李启正,等:织物整理专业术语词义消歧与热点趋势研究9
染整技术45卷
基础上对术语进行语义消歧,尽可能避免热点主题之间的重复问题,结果更加精准,可视化效果更好。

3.2热点预测
考虑Citespace在突发检测功能上的缺陷,本研究使用和Citespace突发检测相同的算法(Kleinberg),重新对织物整理术语进行突发检测,表3是在2020年、2021年存在突发状态最明显的织物整理术语。

本研究预测疏水整理、阻燃整理、拒水整理、抗菌整理和防紫外线整理是未来织物整理领域中文期刊中的学术热点。

以相同的方法分析整理术语的英文表达在Web of Science数据库纺织类期刊34种(31种SCI期刊)共62847篇论文中的逐年出现情况,“防紫外线整理”从2015年开始突发至今,突发强度高达18.7。

同时数据表明,本研究预测的5个学术热点中除了抗菌整理,其他学术热点的国家课题占比均超过平均值(18.75%),说明国家课题对于热点和新兴热点的把握较为敏感。

4结论
通过分析中国知网提供的整理领域学术热点发现,其存在热点主题表达不明确、主题重合以及其导致的热度评级问题;通过分析整理领域关键词突发检测结果发现,其存在关键词选取不规范、未考虑关键词两次突发情况等问题;在收集纺织现有最新版词表《纺织词典》《纺织汉语叙词表》《纺织大百科》、国家现行标准GB/T25799—2010《纺织染整助剂名词术语》以及25691篇中图分类号为TS19(染整工业)学术论文题目、关键词和摘要中名词性术语的基础上,构建整理领域术语表,分析发现整理领域术语表述规范性差,并且规范表达和学术论文中的习惯表达不一致情况明显,严重影响以词频分析为基础的学术热点挖掘。

在专家词义消歧的基础上,研究重新分析整理领域现有的热点和未来的热点,结果在一定程度上和现有整理领域学术热点分析结果相呼应。

阻燃整理、抗菌整理、柔软整理、防皱整理和防紫外线整理是近年来研究较多的整理类型。

疏水整理、阻燃整理、拒水整理、抗菌整理和防紫外线整理是研究趋势,同时预测的学术热点相关论文是国家课题论文的概率更高,这在一定程度上也证明研究预测的准确性。

结果表明对专业领域内的重要术语进行语义消歧可以更好地实现学术热点分析,也可以帮助研究人员、专业期刊和数据库规范专业术语表达,实现语义检索。

参考文献:
[1]华旦草,安培浚,肖仙桃.基于文本内容的科学前沿探测方
法研究进展[J].现代情报,2021,41(1):169-177. [2]KLEINBERG J.Bursty and hierarchical structure in streams
[M].Kluwer Academic Publishers,2002.
[3]徐爽,许丹,韩爽,等.SemRep和突发监测算法在文献计量
分析中的应用——以疾病药物治疗发展趋势为例[J].情
报学报,2021,40(7):745-755.
[4]郝建波.微博突发话题检测、跟踪与传播预测技术研究
[D].哈尔滨:哈尔滨工程大学,2013.
[5]CHEN C.CiteSpaceⅡ:Detecting and visualizing emerging
trends and transient patterns in scientific literature[J].
Journal of the American Society for information Science and
Technology,2006,57(3):359-377.
序号1 2 3 4 6 7 10 11 12 13 14 15 16 18 20 21 22
整理类型
阻燃整理
抗菌整理
柔软整理
防皱整理
防紫外线整理
免烫整理
拒水整理
芳香整理
疏水整理
防缩整理
硬挺整理
抗静电整理
三防整理
吸湿排汗整理
负离子整理
轧光整理
防毡缩整理
主要
论文数
97
53
39
37
23
20
12
11
11
9
9
9
8
7
4
2
1
主要
作者数
176
112
91
87
64
51
25
27
29
20
23
23
11
13
6
3
5
主要
机构数
49
31
42
52
18
36
10
9
13
7
6
11
4
4
2
3
1
国家课题
论文数
21
7
3
5
6
3
4
2
5
1
1
2
1
1
1
1
2
国家课题论
文占比/%
21.64
13.21
7.69
13.51
26.09
15.00
33.33
18.18
45.46
11.11
11.11
22.22
12.50
14.29
25.00
50.00
200.00
表2整理术语一义多词情况统计整理领域学术热点
序号1 2 3 4 5织物整理术语
疏水整理
阻燃整理
拒水整理
抗菌整理
防紫外线整理
突发开始
年份
2017
2020
2018
2019
2019
突发结束
年份
2021
2021
2020
2020
2020
突发
强度
8.02
5.21
2.99
2.45
2.39
国家课题论文
占比/%
45.46
21.64
33.33
13.21
26.09
表3整理领域学术热点预测
10。

相关文档
最新文档