微项目NO.3 计算生成新的数据

合集下载

广东省2024届普通高中毕业班高三上学期第二次调研考试化学试题

广东省2024届普通高中毕业班第二次调研考试化学本试卷共8页，考试用时75分钟，满分100分。

注意事项：1．答卷前，考生务必将自己所在的学校、姓名、班级、考生号、考场号和座位号填写在答题卡上，将条形码横贴在每张答题卡右上角“条形码粘贴处”。

2．作答选择题时，选出每小题答案后，用2B铅笔在答题卡上将对应题目选项的答案信息点涂黑；如需改动，用橡皮擦干净后，再选涂其他答案。

答案不能答在试卷上。

3．非选择题必须用黑色字迹的钢笔或签字笔作答，答案必须写在答题卡各题目指定区域内相应位置上；如需改动，先画掉原来的答案，然后再写上新答案；不准使用铅笔和涂改液。

不按以上要求作答无效。

4．考生必须保证答题卡的整洁。

考试结束后，将试卷和答题卡一并交回。

可能用到的相对原子质量：H 1 C 12 N 14 O 16 Cl 35.5 Fe 56 Mo 96一、选择题：本题共16小题，共44分。

第1~10小题，每小题2分；第11~16小题，每小题4分。

在每小题给出的四个选项中，只有一项是符合题目要求的。

1．“挖掘文物价值，讲好中国故事”。

下列文物的主要成分为有机高分子化合物的是（）A．唐陶文吏俑B．兽面纹青铜盉．金漆木雕大神龛．千金猴王砚2．科技推动社会进步，创造美好生活。

下列说法不正确的是（）99%Mo产品，100Mo与98Mo互为同位素A．我国首次获得公斤级丰度100Nb O是一种新型金属晶体B．我国科学家发现新矿物铌（Nb）包头矿，其中所含25C．无污染长征六号运载火箭采用液氧煤油发动机，煤油属于烃类混合物CH是正四面体结构D．“深地工程·川渝天然气基地”获得新突破，天然气主要成分43．化学与生活密切相关。

下列说法正确的是（）SiOA．大力推广使用太阳能，太阳能电池板材料为2B．长期服用阿司匹林引起酸中毒，可以服用纯碱溶液中和酸C．乡村建设使用水泥盖房和铺路，水泥属于传统硅酸盐材料D．水果罐头中添加维生素C作抗氧化剂，是因为维生素C难被氧化4．关注化学实验，提高实验素养，下列实验装置能达到实验目的的是（）A ．验证22Na O 与水反应的能量变化B ．证明乙炔能使溴水褪色C ．除去3Fe(OH)胶体中的Na +、Cl-D ．干燥氨气5．“为国育才，五育并举”，美育是五育重要组成部分。

2024年7月浙江省普通高中学业水平考试——化学仿真模拟试卷01(解析版)

2024年7月浙江省普通高中学业水平合格性考试化学仿真模拟试卷01(考试时间：60分钟；满分：100分)本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分．考生注意：1．答题前，请务必将自己的姓名、准考证号用黑色字迹的签字笔或钢笔分别填写在试题卷和答题纸规定的位置上。

2．答题时，请按照答题纸上“注意事项”的要求，在答题纸相应的位置上规范作答，在本试题卷上的作答一律无效。

3．非选择题的答案必须使用黑色字迹的签字笔或钢笔写在答题纸上相应区域内，作图时可先使用2B铅笔，确定后必须使用黑色字迹的签字笔或钢笔描黑。

4．可能用到的相对原子质量：H1C12N14O16Na23S32Ca40Fe56 Cu64Ba137第Ⅰ卷(选择题60分)一、选择题Ⅰ(本大题共15小题，每小题2分，共30分。

每个小题列出的四个备选项中只有一个是符合题目要求的，不选、多选、错选均不得分)1．下列不属于硅酸盐材料的是)A．玻璃B．水泥C．陶瓷D．水晶【答案】D【解析】玻璃、水泥、陶瓷均属于传统的无机非金属材料，都属于硅酸盐；水晶的主要成分是二氧化硅，不属于硅酸盐。

故选D。

2．华为公司的5G核心专利在全球排名第一，5G通讯技术离不开光导纤维，制造光导纤维的材料是()A．铝合金B．稀土C．二氧化硅D．晶体硅【答案】C【解析】光导纤维的主要成分是二氧化硅，具有良好的导光性，故选C。

3．配制250mL1.00mol/LNaCl溶液无需用到的仪器是()A．B．C．D．【答案】B【解析】用固体配制一定物质的量浓度的溶液操作步骤有计算、称量、溶解、冷却、转移、洗涤、定容、摇匀、装瓶等操作。

A项，容量瓶是用来配制一定物质的量浓度溶液的，A不符合要求；B项，配制溶液过程中不用圆底烧瓶，故B符合要求；C项，定容时会用到胶头滴管，故C不符合要求；D项，溶解氯化钠固体时用烧杯，故D不符合要求；故选B。

4．下列气体中，既有颜色又有毒性的是A．N2B．SO2C．NO2D．NH3【答案】C【解析】A项，N2没有颜色又没有毒性，A错误；B项，SO2没有颜色有毒性，B错误；C项，NO2是红棕色气体，有颜色又有毒性，C正确；D项，NH3没有颜色有毒性，D错误；故选C。

2024年学习笔记信息系统项目管理师(第四版)第二章-信息技术发展

第⼆章-信息技术发展1-信息技术及其发展1.1-计算机软硬件、计算机⽹络1.计算机硬件是指计算机系统中有电子、机械和光电元件等组成的各种物理装置的总称。

2.计算机软件是指计算机系统中的程序及文档，程序是计算任务的处理对象和处理规则的描述；文档是为了便于了解程序所需的阐明性资料。

3.硬件和软件相互依存。

4.从网络的作用范围可将网络类别划分为：个人局域网（PAN）、局域网（LAN）、城域网（MAN）、广域网（WAN）、公用网、专用网。

5.广域网协议主要包块：PPP 点对点协议、ISDN 综合业务数字网、xDSL、DDN 数字专线、x.25、FR 帧中继、ATM 异步传输模式。

6.IEEE 802 协议族：IEEE 802 规范定义了网卡如何访问传输介质（如光缆、双绞线、无线等），以及如何在传输介质上传输数据的方法，还定义了传输信息的网络设备之间连接的建立、维护和拆除的途径。

7.802.3（以太网的 CSMA/CD 载波监听多路访问/冲突检测协议）、802.11（无线局域网 WLAN 标准协议）。

8.OSI 七层网络模型从上到下：应用层（事务处理程序、文件传送协议）、表示层（管理数据的解密加密数据转换、格式化和文本压缩）、会话层（负责在网络中的两节点之间建立和维持通信，以及提供交互会话的管理功能）、传输层（提供建立、维护和拆除传送连接的功能）、网络层（网络地址 IP 地址翻译成对应物理地址 MAC 地址，并决定如何将数据从发送方路由到接收方，实现拥塞控制。

网际互联等）、数据链路层（物理地址寻址、数据的成帧、流量控制。

数据的检错重发等）、物理层（物理联网媒介，如电缆连线连接器）。

9.TCP/IP 是 Internet 的核心，共四层有：应用层（FTP 文件传输协议、TFTP 简单文件传输协议、HTTP 超文本传输协议、SMTP 简单邮件传输协议、DHCP 动态主机配置协议、Telnet 远程登录协议、DNS 域名系统、SNMP 简单网络管理协议）、传输层（TCP 传输控制协议、UDP 用户数据报协议）、网络层（IP 协议、ICMP 网络控制报文协议、IGMP 网际组管理协议、ARP 地址解析协议、RARP 反向地址解析协议）、网络接口层（底层协议，传输数据的物理媒介）。

气相色谱法分析大气中微量的氧化亚氮

气相色谱法分析大气中微量的氧化亚氮丁晴晴赵新坤（北京北分瑞利分析仪器（集团）有限责任公司"匕京100095$摘要：建立了一套便捷的气相色谱法（GC-ECD）检测大气中微量的氧化亚氮（NO）。

通过改装气相色谱仪、调整十通阀切换方式、选择合适的载气种类，解决了传统微量N2O分析方法存在的灵敏度低、装置复杂、进样阀和色谱柱数量多及阀切换繁琐的问题，可实现0.05mg/m3N2O的准确分析&实验结果表明，改装后的气相色谱定量重复性、灵敏度及线性相关系数均符合分析要求，大气样品中N2O浓度的相对标准偏差（RSD）小于2%，适用于大气中微量N2O的定性及定量分析&关键词：氧化亚氮气相色谱法DOI：10.3969/j.issn.1001—232x.2021.03.010Analysis of trace nitrous oxide in air by gas chromatography with electron capture detector.Ding Qingqing,Zhao Xinkun(.Beijing Beifen Ruiii"Beijing100095,China)Abstract：Bymodifyingthegaschromatograph"adjustingtheswitching modeofthe1"-wayvalveand selecting the appropriate carrier gas type"the problems of low sensitivity"complex device"large number ofinjectionvalvesandchromatographiccolumnsandcumbersomevalveswitchingexistinginthetraditional analysis method of trace N2O are solved,and the accurate analysis of0.1ppm N2O can be realized.The ex-perimentalresultsshowthatthemodifiedgaschromatographyissuitableforqualitativeandquantitativea-nalysis of trace N2O in the atmosphere,and the relative standard deviation(RSD)of N2O concentration in the atmosphere is less than2%.Key words：Nitrous oxide；Gas chromatography1引言氧化亚氮（NO）是一种惰性气体，在大气环境中持久性存在，可留存130〜170年+1,&也是大气中仅次于CO：和CH』的主要温室气体之一，被列入《京都议定书》的减排清单[2]&在大气中N Z O参与一系列的光化学反应，这会引起多种环境问题，其中最重要的是引起全球变暖和臭氧层的破坏&研究表明,N Z O在100年尺度上的温室效应是CO2的298倍，对全球温室效应的贡献率约为6%3&在对流层中,N Z O可使气温升高，温室效应增强4%〜5%;N Z O可输送到平流层，与O3发生反应可生成NO,从而导臭氧层的消耗+47]，大气中的N Z O浓度每增加1倍，会导致平流层中Os减少10%8。

基于爬虫和文本处理的微博舆情分析系统

第28卷第3期北京电子科技学院学报2020年9月Vol．28No．3Journal of Beijing Electronic Science and Technology Institute Sept．2020基于爬虫和文本处理的微博舆情分析系统*刘子谦1＊＊王志强1，21．北京电子科技学院，北京市1000702．国家信息中心，北京市100045摘要：近年来，随着社交网络的兴起，微博自媒体对舆情演变发挥着越来越重要的作用，也给公众舆论管理带来了新的挑战。

本文针对微博舆情监控的实际需求，结合自然语言处理技术，设计并实现了基于爬虫和文本处理的微博舆情分析系统，实现多线程爬虫、多维度数据分析，并进行可视化展示。

该系统可定向搜索某一社会热点话题，帮助用户全面了解网民情感态度，把握舆情发展动态。

关键词：网络爬虫；自然语言处理；舆情监控；数据可视化中图分类号：TP311.56文献标识码：A文章编号：1672－464X （2020）3－31－09*基金项目：信息网络安全公安部重点实验室开放课题项目资助（No．C19614）；中国博士后科学基金面上项目（2019M650606）＊＊作者简介：刘子谦（2001—），男，北京电子科技学院本科学生；王志强（1985—），男，讲师，博士，研究方向为网络与系统安全。

（通讯作者：王志强）1引言随着互联网的发展，大量网民通过自媒体平台发表个人声音，也给舆情监控带来了新的挑战。

微博上大量碎片化信息蕴含着潜在价值，通过分析可以了解民众所关心的社会热点话题，有效监控舆情动态。

政府、企业也能及时引导失实言论，防止舆情进一步恶化，维护其社会公信力。

然而，一方面，微博制定的反爬虫策略限制用户访问频率，数据获取难度大；另一方面，微博语言具有碎片化、多样性、凝练性等特点［1］，增大了情感分析的难度。

同时由于我国互联网发展较晚，网络舆情监控方面的研究也较晚，且成果参差不齐［2］。

以影响力较大的“微热点”网站为例，其关键词搜索功能有明显缺陷，不能自定义时间段搜索数据，并且无法导出博文，不支持智能情感分析，用户只能查看该关键词对应的热度，却无法得知网友的情感动态。

大气环境中tsp、so2和nox浓度测定

大气环境中TSP、SO2和NOx浓度测定一、实验目的1．根据布点采样原则，选择适宜方法进行布点，确定采样频率及采样时间，掌握测定空气中SO2、NO x和TSP的采样和监测方法。

2、通过对环境空气中主要污染物质进行定期或连续地监测，判断空气质量是否符合《环境空气质量标准》或环境规划目标的要求，为空气质量状况评价提供依据。

3、根据三项污染物监测结果计算空气污染指数（API），描述我校空气质量状况。

二、测定项目按照我国《空气环境质量标准GB3095-1996》中规定，大气环境污染监测必测项目有：二氧化硫、氮氧化物、总悬浮颗粒物(TSP)、硫氧化物(测定硫酸盐化速率)、灰尘自然沉降量。

根据我院实际情况监测开放实验主要监测项目为：二氧化硫，氮氧化物和总悬浮颗粒物。

三、空气中污染物的时空分布特点空气中的污染物质具有随时间、空间变化大的特点空气污染物的时空分布及其浓度与污染物排放源的分布、排放量及地形地貌、气象等条件密切相关。

武汉属副热带湿润季风气候，雨量充沛，热量丰富，无霜期长，四季分明。

年平均气温16.80℃，年平均降水量1093.3毫米。

年晴天日数208．9日，海拔高度在39—43米之间。

图2-1 武汉市风玫瑰图1、风向我们知道理想大陆上的气压带、风带是如此的规则、单一、稳定，但是在现实中，我们是无法找到这样的地区的。

为了表示一个地区在某一时间内的风频、风速等情况，就需要更科学、更直观的统计方式──风玫瑰图，用风玫瑰图来反映一个地区的气流情况，更贴近现实。

风玫瑰图在气象统计、城市规划、工业布局等方面有着十分广泛的应用。

风玫瑰图是以“玫瑰花”形式表示各方向上气流状况重复率的统计图形，所用的资料可以是一月内的或一年内的，但通常采用一个地区多年的平均统计资料，其类型一般有风向玫瑰图和风速玫瑰图。

风向玫瑰图又称风频图，是将风向分为8个或16个方位，在各方向线上按各方向风的出现频率，截取相应的长度，将相邻方向线上的截点用直线联结的闭合折线图形。

a卵巢癌SKOV3裸小鼠移植瘤血管生成的影响

—２７５４．
［９］ＨｕａｎｇＣＹ，ＦｏｎｇＹＣ，ＬｅｅＣＹ，ｅｔａ１．ＣＣＬ５ｉｎｃｒｅａｓｅｓｈｎｇｅａｎｃｃｒｍｉｇｒａｔｉｏｎｖｉａＰＤＫ，ＡｋｔａｎｄＮＦ—ｋａｐｐａＢｐａｔｈｗａｙｓＢｉｏｃｈｅｍＰｈａｒｍａｃｏｌ［Ｊ］．ＢｉｏｃｈｃｍＰｈａｒｍａｅｏｌ，２００９，７７（５）：７９４—８０３．
6j13试剂与仪器vegf兔抗人单克隆抗体za一0509北京中杉金桥公司dlia兔抗人多克隆抗体ab7280abcam公司cd31兔抗鼠多克隆抗体ba2211武汉博士德envision二步法试剂盒dako公司htl组织芯片制备仪辽宁恒泰公司moticvirtualmicroscope10显微摄像系统motic公司lmageproplus502图像分析系统mediacyberneticsincusaj14实验方法141动物模型的建立及分组给药方案人卵巢癌skov3裸小鼠移植瘤模型由skov3细胞株接种于裸小鼠左侧胸壁皮下而建立
ｂｙｉｍｍｕｎｏｈｉｓｔｏｃｈｅｍｉｃａｌｓｔａｉｎｉｎｇｏｆＣＤ３１．ＲｅｓｕｌｔｓＴｈｅｅｘｐｒｅｓｓｉｏｎｏｆＶＥＧＦ。ＤＬＩＡａｎｄＭＶＤｖａｌｕｅｓｉｎｃｈＡ２１ｇｒｏｕｐｗｅｒｅｌｏｗｅｒｔｈａｎｔｈｏｓｅｉｎｃｏｎｔｒｏｌｇｒｏｕｐ（Ｐ＜０．０５）．ＣｏｎｃｌｕｓｉｏｎｅｈＡ２１ｉｎｈｉｂｉｔｓｔｈｅａｎｇｉｏｇｅｎｅｓｉｓｏｆｔｒａｎｓｐｌａｎｔａｔｉｏｎｓｏｆｈｕｍａｎｏｖａｒｉａｎｃａｎｃｅｒＳＫＯＶ３ｃｅｌｌｓｅｆｆｅｃｔｉｖｅｌｙ．Ｋｅｙｗｏｒｄｓ：ｏｖａｒｙｎｅｏｐｌａｓｍｓ；ＨＥＲ－２；ｅｈＡ２１；ＶＥＧＦ；ＤＬＬ４；ａｎｇｉｏｇｅｎｅｓｉｓ
收稿１３期：２００９—０９—２０基金项目：国家“８６３”计划项目（２００１ＡＡ２１５３８１）作者单位：１安徽医科大学病理学教研室，合肥２３００３２

数据中心新型保温技术的探索和实践

数据中心新型保温技术的探索和实践金培祁1陈养辉2(1.中国电信股份有限公司浙江分公司浙江杭州 310000;2.中兴通讯股份有限公司浙江杭州 310012)摘要：随着国家科技的发展，数据中心产业发展迅速。

根据国家公共建筑节能设计有关标准，绿色数据中心的建设逐渐成为未来数据中心建设势在必行，绿色数据中心建设理念贯穿于全寿命投资的各个方面。

该文从数据中心建设节能总体出发，通过实际案例分析研究，并有效提升节能增效技术与新材料的创新及应用，希望能够为国家公共建筑和数据中心建设施工提供借鉴和参考。

关键词：数据中心保温技术绿色低碳双碳中图分类号：TP30文献标识码：A 文章编号：1672-3791(2023)17-0162-04 Exploration and Practice of New Thermal Insulation Technology inData CentersJIN Peiqi1CHEN Yanghui2(1.Zhejiang Branch of China Telecom Corporation, Hangzhou, Zhejiang Province, 310000 China;2.ZTECorporation, Hangzhou, Zhejiang Province, 310012 China)Abstract:With the development of national technology, the data center industry is developing rapidly. According to the relevant national standards for energy-saving design of public buildings, the construction of green data centers is gradually becoming an imperative for future data center construction. The concept of green data center construc‐tion runs through various aspects such as full life investment. This article starts from the overall energy-saving con‐struction of data centers, analyzes and studies practical cases, and effectively improves the innovation and application of energy-saving and efficiency enhancing technologies and new materials. It is hoped to provide reference and reference for the construction of national public buildings and data centers.Key Words: Data center; Thermal insulation technology; Green and low-carbon; Dual carbon2020年，国家发改委发布了《关于加快构建全国一体化大数据中心协同创新体系的指导意见》，意见明确指出为推动数据中心绿色高质量发展，要集中力量建设全国算力枢纽体系。

英飞凌编程工具的使用

开发工具的使用英飞凌XC800系列单片机写在前面本篇内容为英飞凌科技有限公司（Infineon Technologies CO., LTD.）的XC800系列单片机的基础篇之一。

如无特别说明，所指的产品为XC800系列单片机中的首款型号：XC866。

由于后续芯片会有更多的改进／增加措施，如需要关注其它产品，需要再结合相应的产品数据手册（Data Sheet）和用户手册（User Manual）！由于版本更新等原因，可能会出现各版本间的资料说法有略微差异，请以英飞凌网站公布的最新英文版本的产品数据手册（Data Sheet）和用户手册（User Manual）为准！内容英飞凌8位单片机硬件的连接基本的硬件连接方式DAvE的安装与使用DAvE软件用于配制项目文件，设置端口，定时器工作方式等 Keil软件的安装与使用Keil软件编辑（插入）用户代码实现用户目标功能编译源文件，生成目标代码软件仿真下载工具的安装与使用FLOAD软件下载程序到目标芯片MEMTOOL软件下载程序到目标芯片硬件的连接XC866评估板（Starter Kit）结构图：直流：8~18V/300mA硬件连接连接步骤将串口和电脑串口连接连接电源。

当连接好电源时，电源指示灯点亮在连接OCDS调试接口时，需要注意，应该将箭头端连接到开发板上针脚1处。

使用OCDS调试接口，同样能够下载程序到单片机，不一定需要通过串口下载程序到目标机，再进行调试。

为了方便学习，下面介绍一个程序的基本流程。

包括创建，编译，仿真，下载并运行一个工程项目。

在项目中，将要实现试验板上LED灯闪烁功能。

LED灯连接到XC866单片机的P3_0到P3_7口。

在工程完成后，LED 灯将不断闪烁。

英飞凌公司（Infineon）的DAvE（Digital Application Virtual Engineer，数字应用虚拟工程师）免费软件是该公司针对其8位(C500/C800/XC800系列)、16位(C166/XC166/XE166系列)和32位(XC2000/TriCore系列)微控制器家族而推出的应用代码生成器。

VFP考试必备基础知识总结

BOF()指针指向记录开始标志RECNO()检测当前记录号如果SEEK””找到了与索引关键字相匹配的记录，RECNO返回匹配记录的记录号，FOUND 返回T，EOF返回F，否则RECNO返回表中记录+1，FOUND返回F，EOF返回TDBC（）返回当前打开的数据库的完整文件名，无参DBGETPROP(a,b,c)返回属性，字符型a:指定数据库、表、字段、视图名b:指定对象名的类型（DATABASE/TABLE/FIELD/VIEW）例如：DBSETPROP(“js.xb”,”FIELD”,”Caption”,”性别”)DBUSED(a) 用于测试数据库是否打开。

如果指定的数据库是打开的则返回真(a为字符型) DELETED()用于测试并返回一个指示当前记录是否加删除标志的逻辑值EMPTY()用于确定指定表达式是否为空FCOUNT() 返回表中的字段数FILE()用于在磁盘中寻找指定的文件，如果被测试的文件存在，函数返回真SEEK()寻找被索引的表中，索引关键字值与指定的表达式相匹配的第一个记录，然后再返回一个值表示是否成功找到匹配记录ORDER() 返回当前表或指定表中控件索引文件或控件索引标记的名称CREATEOBJECT()从类定义或OLE对象中建立一个对象USED()确定表是否在指定工作区中打开TAG()返回打开的、多入口复合索引文件的标记名或返回打开的、单入口的文件名GETOBJECY()激活OLE自动对象，然后建立该对象的引用1数据库系统（DBS）一般由数据库(DB)、_数据库管理系统(DBMS)_计算机支持系统、应用程序和有关人员(DBA)组成。

2.数据库中的数据按一定的数据模型组织、描述和储存，具有较小的冗余度_、较高的数据独立性和易扩展性，并可以供各种用户共享。

3．数据库通常包括两部分内容：一是按一定的数据模型组织并实际存储的所有应用需要的数据；二是存放在数据字典中的各种描述信息，这些描述信息通常称为元数据。

基于卷积神经网络的Leap Motion运动数据优化网络

第33卷第3期计算机辅助设计与图形学学报Vol.33No.3 2021年3月Journal of Computer-Aided Design & Computer Graphics Mar. 2021基于卷积神经网络的Leap Motion运动数据优化网络张欣天1), 谢文军2), 李书杰1), 刘晓平1)*1) (合肥工业大学计算机与信息学院合肥 230601)2) (合肥工业大学软件学院合肥 230601)(************.cn)摘要: 为提高Leap Motion设备的采集精准度, 解决自遮挡、采样频率不稳定等设备固有问题, 首先, 设计了使用Leap Motion和动作捕捉设备的手部多模态同步运动采集方案, 采集了日常动作数据集; 其次, 提出了基于卷积神经网络(convolutional neural network, CNN)的Leap Motion手部运动数据优化方法, 使用日常动作数据集训练Leap Motion 数据到动作捕捉数据的映射网络; 最后, 提出手指平面约束, 确保网络输出数据保持稳定的手部骨骼结构. 通过15名志愿者采集了6类动作共967 550帧的同步运动数据集, 进行了手指平面约束有效性、动作一致性实验, 并与双向循环自编码器(bidirectional recurrent autoencoder, BRA)、双向编解码器(encoder-bidirectional-decoder, EBD)方法进行了精度对比. 结果表明, 文中方法支持使用Leap Motion获取固定采样频率且近似动捕设备精度的手部运动数据, 效果较BRA和EBD更加稳定平滑. 将文中方法应用于康复游戏中, 明显减少了交互动作识别的错误次数.关键词: 运动数据优化; Leap Motion; 卷积神经网络; 多模态数据集; 自遮挡中图法分类号: TP391.41 DOI: 10.3724/SP.J.1089.2021.18425Convolutional Neural Networks Based Motion Data Optimization Networks for Leap MotionZhang Xintian1), Xie Wenjun2), Li Shujie1), and Liu Xiaoping1)*1) (School of Computer Science and Information Technology, Hefei University of Technology, Hefei 230601)2) (School of Software, Hefei University of Technology, Hefei 230601)Abstract: It is necessary to improve the capture accuracy and precision of Leap Motion equipment, and solve its inherent problems such as finger self-occlusion and instable sampling frequency, firstly, a multi-modal synchronous hand motion capture scheme is proposed based on Leap Motion and motion capture devices, and the dataset is captured correspondingly. Secondly, a convolutional-neural-network-based hand motion data optimization method for Leap Motion is presented. The proposed network is trained to learn the map-ping from Leap Motion data domain to motion capture data domain with the synchronous dataset. Finally, a coplanar constraint for human fingers is proposed, which makes the outputs maintain stable hand skeleton structure. The 967 550 frames of synchronous hand motion data are captured in 6 categories from 15 volun-teers. Experiments are designed for validating of the finger coplanar constraint, testing the consistency of the optimized motion data, and the comparison with BRA (bidirectional recurrent autoencoder) and EBD (en-coder-bidirectional-decoder) methods. Experiments indicate that proposed method supports for capturing收稿日期: 2020-06-05; 修回日期: 2020-11-12. 基金项目: 国家自然科学基金(61877016, 61972128, 61702155); 中央高校基本科研业务经费(JZ2018HGTA0215).张欣天(1995—), 男, 硕士研究生, CCF学生会员, 主要研究方向为计算机图形与可视化; 谢文军(1984—), 男, 博士, 实验师, CCF会员, 主要研究方向为运动数据采集与交互; 李书杰(1983—), 女, 博士, 讲师, 硕士生导师, CCF 会员, 主要研究方向为运动数据处理、深度学习算法; 刘晓平(1964—), 男, 博士, 教授, 博士生导师, CCF理事, 论文通讯作者, 主要研究方向为计算机图形学、协同计算.440 计算机辅助设计与图形学学报第33卷hand motion data with fixed sample frequency and MoCap-like precision using a Leap Motion. Furthermore, the proposed method can obtain smoother and more stable results than BRA and EBD. The method is also applied in rehabilitation games, which significantly reduces the number of errors of hand interaction motion recognition.Key words: motion data optimization; Leap Motion; convolutional neural networks; multi-modal synchronous dataset; self-occlusion人手是人机交互过程中主要的交互手段[1]. 手部运动数据在计算机领域拥有诸多用途, 如识别手势动作语义[2]、分析手功能康复效果[3]、支持虚拟现实自然交互[4]等. 为了支撑这些应用, 便捷且尽可能精确地获取手部运动数据有着重要的现实意义. 现有最高精确度的方法是通过各类动作捕捉设备(下文简称动捕)采集手部运动, 但相关设备价格相对昂贵, 且需要贴身固定标记物或传感器, 使用户运动受到束缚, 影响用户体验. 近些年逐渐涌现出一批成本低、无标记、非接触的体感设备, 而面向手部的体感设备中最具有代表性的是LEAP公司出品的Leap Motion, 此类非接触式的实时手部运动采集设备“为基于手势交互的人机交互系统带来变革”[5].Leap Motion可采集范围为一个倒锥形, 采集范围距离设备中心点的垂直距离为25~600mm, 在采集数据的过程中不可避免地存在距离敏感的精度问题和自遮挡现象. 例如, 当用户手背面向红外相机做握拳动作时, 手指如图1a所示在弯曲时会被手背遮挡, 此时可能发生Leap Motion无法捕获到手, 出现如图1b所示手指变形的现象, 而如图1c所示动捕数据表现相对稳定. 一些研究者针对此问题提出了相应的精度优化策略, 如谷学静等[6]利用层次化的校正方法提高Leap Motion的识图1 遮挡状态下Leap Motion可能发生的采集错误和动捕采集的正确结果别准确性; 孙国道等[7]针对单Leap Motion交互空间局限性带来的自遮挡问题, 提出使用双Leap Motion方案, 但仍存在校正方法单一、数据融合方法复杂等问题.近年来, 深度学习方法在人体运动数据分析和优化领域展现出了出色的效果. 例如, Bütepage 等[8]使用全连接生成网络实现运动数据缺损修复; Holden等[9]提出的自编码器可以在隐变量空间中对运动数据进行编辑和修正, 在相应数据集的支撑下, 其效率和效果皆得到了提升. 虽然手部运动数据也是全身运动数据的一部分, 但目前用神经网络进行针对手部数据优化的工作还较少, 其原因主要在于有标签的手部运动数据集较少. 现有主流人体运动数据集(如CMU运动数据集[10], HDM05数据集[11]和Berkeley MHAD数据集[12]等)均不包含手部数据. 针对手部建立的数据集通常会应用于机器视觉领域研究, 以RGBD图像或视频[13-15]形式保存, 缺乏多模态的同步数据, 更缺乏适用于Leap Motion设备数据优化的专用数据集.因此, 本文设计了面向Leap Motion和动捕设备的同步采集方案, 构建了多模态同步数据集; 搭建了基于卷积神经网络(convolutional neural net-works, CNN)的深度神经网络, 对Leap Motion所采集的手部运动数据进行优化, 以期基于Leap Motion设备实现实时、非接触且有动捕精度级别运动数据采集. 本文的工作主要围绕以下3点开展.(1) 针对使用深度学习方法进行手部运动数据优化的相应数据需求, 提出一种Leap Motion与动捕设备同步采集方案, 构建多模态手部运动同步数据集.(2) 在同步数据集的基础上, 提出一种基于CNN的Leap Motion数据优化网络结构, 用于Leap Motion设备的实时数据优化.(3) 针对神经网络输出结果的微抖动问题, 结合手部结构特征, 提出一种新的手指平面约束, 用于提高精度和运动平滑性.第3期张欣天, 等: 基于卷积神经网络的Leap Motion运动数据优化网络 4411 相关工作为探索Leap Motion在精度、稳定性等方面的具体表现, 研究者进行了一系列有针对性的实验分析. Weichert等[16]通过精确度较高的机械臂分析Leap Motion采集数据的精确度与鲁棒性, 结果显示对于静态位置的测量精度可达0.2mm, 而对于动态位置的测量精度要低得多. 这一结论也在随后的实验中得到证实, Guna等[5]利用模型手进行实际评测, 得出Leap Motion还无法应用于专业的跟踪系统中这一结论. Bachmann等[17]将鼠标与Leap Motion作为选择任务的输入设备进行对比, 得出Leap Motion设备在选择识别方面表现能力有限. 近2年, 一些研究团队对Leap Motion其他方面进行评估. Niechwiej-Szwedo等[18]将Leap Motion与标准的动作捕捉设备Optotrak进行对比, 在15名实验人员的参与下分别进行了3组实验, 在评估手的时空准确性、峰值速度误差方面与动捕设备仍有差距, 这可能会限制Leap Motion在某些场景下的使用. 文献[19]指出, Leap Motion还存在采集频率不稳定的问题.为了弥补上述Leap Motion问题, 研究者提出了各类数据优化方法. 例如, Ponraj等[20]利用隐马尔可夫模型进行运动数据的合成, 其对于手势识别有所改善. 但为了克服遮挡问题, 通过双Leap Motion同时进行数据采集是更加常见的方法. Fok 等[21]为了处理用户手在实际交互过程中存在自遮挡的问题, 引入了额外的Leap Motion进行同步采集, 提高对美国手语(American sign language, ASL)的识别精度. Jin等[22]提出了一种基于双Leap Motion 的手势识别系统, 用于机器人系统中的远程控制, 在通过增加传感器的同时, 自定义当前Leap Motion 状态; 在实际应用中选择2个Leap Motion中“稳定”的作为系统的输入, 在一定程度上解决了自遮挡问题. 孙国道等[7]综合分析、比较了2个Leap Motion摆放位置, 提出了以垂直方式摆放为最佳方式, 不过在数据融合方面只是简单地对2个Leap Motion采集的数据进行平均, 在某些情况下仍然无法彻底解决自遮挡问题. 多台Leap Motion 的引入, 势必进行一系列的数据融合操作, 增加了计算复杂程度. 此外, 2个设备发出的红外光会相互影响引起测量误差[23]. Marin等[24]将Leap Motion 与Kinect设备结合, 以此提高手势识别的准确率, 但该方法增加了系统的复杂度, 不利于系统移植. Cai等[25]提出了一种基于Leap Motion和Metaio的交互式增强现实系统方法, 增强了系统的交互体验, 但是没有解决数据的精确度问题.目前, 在人体运动数据处理方面, 研究者提出了多种可行的网络模型. Fragkiadaki等[26]采用了一种双向编解码器结构(encoder bidirectional decoder, EBD)模型, 但该模型本身并非用于数据去噪且未考虑运动学约束, 训练效果不佳. Holden等[27]提出基于CNN的数据自编码器处理运动数据, 但在实际处理过程中, 网络输出的数据会出现不同程度的抖动和骨骼变形现象. Mall等[28]提出了双向编码滤波器模型(encoder-bidirectional filter, EBF), 该模型无法处理数据输入与输出对应的拓扑结构不同的情况, 即无法让Leap Motion数据精确度优化到动捕级别. Li等[29]提出双向循环自编码器(bidirectional recurrent autoencoder, BRA), 用于对带有多种噪声的骨骼数据进行优化, 得到的运动数据更加符合运动学特征, 具有更好的视觉效果. 受上述文献的启发, 本文提出利用动捕设备与Leap Motion同步采集的方式进行数据采集, 利用CNN 对Leap Motion采集的数据进行优化. 整体框架如图2所示.图2 系统框架示意图2 同步数据采集方案和数据集构建提高深度神经网络模型的准确度需要大量数据的支撑, 调研发现, 目前并没有适用于Leap Motion等手部体感设备的公开同步手部运动数据集. 因此, 本文首先利用Perception Neuron 和Leap Motion设备建立多模态手部运动同步数据采集方案.2.1 采集方案设计采集系统设计如图3所示. Leap Motion采用桌面工作模式, 平置于用户前方的桌面. 用户手部穿戴Perception Neuron运动捕捉设备, 手掌中心水平位置与Leap Motion中心重合, 垂直距离为15~20cm. 为了减少由于超出Leap Motion有效采集范围而形成长时间错误数据, 在桌面绘制参考量程边界. 其中上下边界距离设备20cm, 左右边界距离设备27cm.442 计算机辅助设计与图形学学报第33卷a. 用户与设备相对位置要求b. 实际采集场景示意图3 采集系统组成协助采集本实验数据集的志愿者共有15名, 年龄分布在20~27岁. 结合日常生活中常见手动作, 采集的动作类型有翻转、握拳、对指和食指指向, 采集手均为左手, 每人每种动作采集10次以上, 共形成6组数据, 共计训练集帧数797 325帧, 测试集帧数为170 225帧.动捕设备、Leap Motion对应的左手拓扑结构如图4所示, 采集的每一帧运动数据由所有节点三维坐标构成.图4 设备采集的手拓扑结构由于Leap Motion只可对手部进行识别[17], 直接佩戴动捕设备的传感器绑带会破坏手部特征, 导致Leap Motion识别困难. 本文实验通过佩戴棉手套将动捕传感器包裹, 减少佩戴传感器造成的手指表面跳变, 同时维持与皮肤接近的红外光反射率, 以降低引入动捕设备对Leap Motion设备采集的影响.2.2 数据预处理与时空同步2.2.1 空间同步对原始数据进行归一化处理, 统一空间尺度. 对于动捕数据, 将图4a中节点0作为根节点; 相应地, 对于Leap Motion数据, 将图4b相对位置较近的节点21作为根节点, 将其他节点坐标转换为相对坐标. 同时, 依据所采集的骨骼长度大小计算, Leap Motion与动捕数据的单位比例为1000∶1, 通过对Leap Motion数据进行缩放, 达到尺度归一化.数据归一化后, 本文以动捕数据位姿为基准, 将Leap Motion数据进行水平旋转Leap Mocap(,)R d d, 其中, Leapd和Mocapd分别为Leap Motion和动捕数据中根节点到中指指尖的向量.对Leap Motion中,x z坐标进行矩阵操作()()T TLeap Mocap(,) x y z x y z R''=⨯d d(1) 将Leap Motion数据与动捕数据空间对齐.2.2.2 时间同步本方案使用的动捕设备采样频率为稳定60Hz, 而Leap Motion采样率并不稳定, 均值约为115Hz. 因此, 以动捕设备的采样率和时间域为基准进行时间同步. 在数据采集时要求动捕设备最后打开、最先关闭, 以保证其采集时间域中一定存在对应的Leap Motion数据. 假设Mocap1T和Mocap2T分别代表动捕设备开始和结束采集时刻; Leap1T和Leap2T代表Leap Motion设备开始和结束采集时刻. 对于时域Mocap1T和Mocap2T中每一帧数据Mocap_id, 获取其时间值Mocap_it; 通过三次样条差值, 如图5所示从Leap Motion的原始数据中采样数据Leap_resample Mocap_Mocap_(,)i i if t=d d,最终形成时域同步的Leap Motion数据.图5 帧数据插值示意图3 数据优化网络3.1 数据初始化对同步后的原始数据, 采用滑动窗口的方式分别对Leap Motion和动捕数据进行分割. 设T为滑动窗口的长度, S为滑动步长, 本文取60T=, 30S=, 将数据初始化为数据段输入深度神经网络.然后, 将所有数据随机分为训练集和测试集2个部分, 其占比分别为80%和20%. 为了确保训练集和测试集中的样本在语义上同分布, 对于每个运动语义数据的划分均保持该比例.第3期张欣天, 等: 基于卷积神经网络的Leap Motion 运动数据优化网络 4433.2 网络结构设计本文提出的网络结构由编码器和解码器2个部分组成, 如图6所示. Leap Motion 源数据输入维度为m ×60×69. 其中, m 为同时输入到网络中数据文件个数; 每个数据文件包含60帧数据; 69代表LeapMotion 23个关节点, 每个关节点对应,, X Y Z 这3个通道. 编码器由卷积层、激活层和池化层组成. 其中, 卷积层的维度为25×69×256, 分别代表卷积核的宽度、输入数据列数和卷积核的数量; 卷积层的输出数据经过激活函数ReLU 输入到池化层. 本文采用的池化方法是最大池化. 在解码器部分, 包含反池化层和反卷积层2部分. 与卷积层对应, 反卷积层的维度为25×256×60; 其中, 60表示为输出数据特征数(20个节点, 每个节点对应3个通道).图6 面向多模态手部同步数据的优化网络结构在网络训练过程中, 本文引入了文献[27]对于全身运动数据优化时使用的空间位置约束、骨骼长度约束和平滑性约束, 并根据手指运动学特征, 提出了手指平面约束.3.2.1 手指平面约束人手骨骼可近似看做刚体结构, 尤其是各个手指关节. 在手运动过程中, 指尖、指端关节、指间关节和指掌关节构成的向量123,, v v v 始终处于同一平面内, 如图7所示. 现以食指为例, 设某次迭代过程中, 网络输出为0120{,,,}O O O O P P P P = . 其中, 4O P ,5O P ,6O P ,7O P 分别为食指上4个节点坐标, 则向量123,, v v v 计算公式为 145O O P P =-v (2)265O O P P =-v (3)375O O P P =-v (4) 将得到的向量单位化, 得到其对应的单位向量123,, e e e . 向量对应的混合积为index 123()F =⋅⨯e e e (5) 当向量123,, e e e 共面时, 其对应的混合积应为零; 混合积越小, 表明越符合平面约束. 因此, 引入关于手指平面约束的损失函数定义为2222ring f index middle little 1()4F L F F F =⨯+++ (6)其中, index F ,middle F ,ring F 和little F 分别为食指、中指、无名指和小拇指对应的混合积. 由于拇指结构特殊性, 相较于其他4指缺少指间关节, 因此本文未考虑对拇指的平面约束.图7 用于手指平面约束计算的向量3.2.2 空间位置约束本实验中位置的输入为相对坐标, 为保证网络输出结果尽可能与原始位置相近, 为方便后续将相对坐标转换为绝对值坐标, 本文引入了空间位置约束. 空间位置约束相关的损失函数定义为192Out_Leap_p 0112j jj P P L m =-=⨯⨯∑ (7)其中, m 的值为20, 代表输出的20个关节点; Out _j P 和Leap _j P 分别对应网络输出和源数据中编号为j 的坐标值.3.2.3 骨骼长度约束为保证数据优化前后手部骨骼长度具有一致性, 在训练过程中添加骨骼长度约束. 设某次迭代过程中网络输出集合Out Out _0Out _1Out _19{,,,}P P P P = , 则拇指远指端骨骼对应节点为Out _2P 和Out _3P , 如图4所示, 相应的长度Out2_3D 可表示为Out_3Out_2Out2_3P P D -= (8) 计算其余骨骼节点长度方法类似. 集合OutD 保存最终网络输出的手部骨骼长度, Leap D 表示Leap Motion 捕获的手部骨骼长度, 最终得到关于骨骼长度的损失函数为6019Out_Leap_b 10i i i j D D L ==-=∑∑ (9)其中, Out _i D 和Leap _i D 分别为第i 帧对应的手部骨骼长度集合.3.2.4 平滑性约束为确保相邻帧间的数据连续性, 对网络输出后444计算机辅助设计与图形学学报第33卷的数据进行帧间平滑性约束. 其损失函数[29]定义为s 21L j ='OY (10) 其中,(2)(2)110000121000012000000210000121000011m m +⨯+-⎛⎫ ⎪- ⎪ ⎪- ⎪= ⎪ ⎪- ⎪- ⎪ ⎪-⎝⎭ O (11) 表示平滑矩阵; m 代表帧数; j 为关节点的个数;'OY 是通过在网络输出的基础上重复第1帧数据和最后1帧数据得到.网络最终采用的损失函数为p s b f L a L b L c L d L =⨯+⨯+⨯+⨯ (12)为确保p L ,s L 与b L 在同一数量级, 方便网络训练,本文中设1a d ==, b c ==0.000 2. 4 实验与分析本文的网络模型训练和应用均在个人计算机上进行, 其中, CPU 为******************GHz, 内存为16 GB, 显卡为NVIDIA GeFoce1080 GTX, 显存为8 GB; 操作系统为Windows10, 64位, 深度学习环境为TensorFlow 1.7.0, 应用展示平台为Unity3D 引擎. 4.1 手指平面约束有效性为验证第3节提出的手指平面约束对于手部运动特征的有效性, 本节分别选取拇指对食指、拇指对中指与拇指对无名指3种手部动作序列作为输入, 记CNN 在添加了空间位置约束、骨骼长度约束和平滑性约束后的网络输出为nf CNN , 记CNN 同时添加第3.2节中介绍的4种约束后的输出为f CNN , 各选取运动片段中对应的3帧数据作为结果展示, 如图8所示.a. 运动片段b.nf CNNc.f CNN图8 运动片段效果对比从图8可以看出, nf CNN 输出的结果中某些骨骼关节会扭曲变形; 在拇指对食指运动过程中, fCNN 无法较好地还原拇指动作; 此外, nfCNN 对应的手部运动数据实际播放会有明显的抖动现象; 从而可以验证本文提出的手指平面约束的有效性.4.2 数据优化后与实际动作一致性实验为验证本文网络在自遮挡现象发生时的处理能力, 分别选取掌心背向Leap Motion 做握拳动作(见图1)和手翻转这2种动作进行实验. 第1种动作之前已进行分析, 在手翻转过程中, 当掌心方向与Leap Motion 垂直时, 靠近Leap Motion 位置的手指会不同程度地遮挡住较远位置的手指, 使数据精确度受到影响. 在握拳过程中, 选择食指指间关节角度和指掌关节角度作为对比, 在运动过程中比较原始数据值、优化后数据和动捕数据之间大小, 实验结果如图9所示. 在手翻转和握拳过程中,选择中指(11号节点)空间运动轨迹作为对比, 其对应的实验结果如图10所示.由于在握拳的过程中, 手掌遮挡住Leap Motion探测器的视野, 发生自遮挡现象. 图9中原始数据关节角度变化幅度远没有达到实际中达到的角度范围, 优化后数据对应的角度变化趋势与动捕数据近似, 表明数据优化后可以较好地恢复原始的手部动作. 由图10可知, 不论在原始数据噪声较大(图10a)或相对平稳(图10b)的情况下, 优化后数据的空间节点位置仍能够接近动捕原始轨迹.图9 握拳动作中手指的主要关节角度结果对比第3期张欣天, 等: 基于卷积神经网络的Leap Motion运动数据优化网络 445图10 中指指尖运动轨迹对比图(单位: 1/10 mm)4.3对比实验手部动作帧之间的平滑性高低、位置误差大小等因素是衡量网络结构输出的重要指标, 因此, 本文选择数据集中握拳、拇指对中指、食指指向3种手部数据作为测试集, 比较CNN结构[27], BRA结构[29], EBD结构[28]和本文提出的优化方法各自对应的3种类型误差: 手骨骼长度误差和帧间误差、空间位置误差, 以此进行对比实验, 结果如图11所示.经过实验可得出如下结论.(1) 在空间位置误差方面, 本文方法与CNN 结构相近, EBD和BRA方法的位置误差相对略高.(2) 对于选择的3种手部动作, 本文方法得到的手骨骼长度误差均为最低值, 更为接近实际动捕数据值.(3) 所有动作对应的平滑度误差中, 本文方法误差最低, 总体稳定在0.2左右, 视觉效果更佳.综上所述, 本文提出的基于CNN的Leap Mo-tion运动数据优化网络总体表现优于其他网络模型, 且手指平面约束的引入使之能够针对性地提高优化结果的平滑性和视觉效果.4.4数据优化方法有效性分析为了验证本文所提的方法在应用场景中的实际效果, 本文选取了抓放目标物体的简单交互场景进行相关实验, 并邀请了15名年龄分布为20~27岁的志愿者来进行交互系统的任务测试. 他们中既有熟悉Leap Motion设备的研究人员, 也有了解或未接触Leap Motion设备的一般人员.图11 不同方法在3种测试动作下对应误差对比446 计算机辅助设计与图形学学报第33卷具体实验内容如下: 虚拟场景上方区域会随机刷新4个不同物体, 在60s规定时间内, 参与者通过捏合抓取、捏住移动、释放等一系列动作, 将物体放入下方盒子内. 每放置成功一次, 场景内会随机出现新的物体, 如图12所示.图12 抓放物体场景在实验过程中, 记录并保存了参与者手部全程运动数据, 并将数据通过本文方法进行优化, 随后将优化后的数据重新应用在场景中. 分别记录数据优化前后每位参与者抓取失败次数和最终成绩并计算出平均抓取失败次数.参与者的抓取失败次数统计结果如图13所示. 数据优化前后的平均抓取失败次数分别为 4.2和1.4, 可见随着数据准确度的提升, 由误判导致的抓取失败次数下降, 使判定结果更加符合真实情况.图13 各参与者抓取失败次数实验前后各参与者的最终成绩结果如图14所示. 由于运动数据优化后, 在抓取过程中手指动作更符合预期, 使整体最终得分提高了12.45%.实验结果表明, 尤其对未接触过Leap Motion设备的一般人员(P3, P6, P9, P12, P15)抓取的数据, 本文数据优化效果提升明显, 更符合用户的交互需求.图14 各参与者最终成绩结果5 结语目前对于Leap Motion设备局限性导致的数据精度下降问题, 利用深度神经网络结构对其数据进行优化的相关研究仍较少. 针对缺乏适用于Leap Motion设备数据优化的数据集, 本文设计出了同步采集方案, 建立了面向Leap Motion和动捕设备的同步数据集. 基于此, 本文提出了基于CNN的Leap Motion运动数据优化网络, 较好地解决了Leap Motion数据精度问题, 有效地提高了交互过程中识别准确性. 此外, 本文根据手部特征, 在网络训练过程中创新性地引入手指平面约束, 很好地解决了网络输出抖动问题.本文方法仍有较大的扩展空间. 首先, 通过设计和收集更加完备的同步数据采集方案, 能够使其进一步扩展到更多的应用场合; 其次, 当前的输入设备只采用单一Leap Motion设备, 未来将扩展到多个Leap Motion输入的情况, 从而扩大系统采集范围.参考文献(References):[1] Zhang Fengjun, Dai Guozhong, Peng Xiaolan. A survey onhuman-computer interaction in virtual reality[J]. Scientia Sini-ca: Informationis, 2016, 46(12): 1711-1736(in Chinese)(张凤军, 戴国忠, 彭晓兰. 虚拟现实的人机交互综述[J]. 中国科学: 信息科学, 2016, 46(12): 1711-1736)[2] Ye Sufen, Lai Jizhou, Lyu Pin, et al. An intelligent perceptionand gesture recognition technology for wearable piano-playing glove[J]. Chinese Journal of Scientific Instrument, 2019, 40(5): 187-194(in Chinese)(叶素芬, 赖际舟, 吕品, 等. 穿戴式钢琴弹奏手套智能感知与手势识别技术[J]. 仪器仪表学报, 2019, 40(5): 187-194) [3] Yi Rongwu, Wang Aimin. Design of remote rehabilitationtraining robotic system for fingers[J]. Electronic Measurement Technology, 2016, 39(9): 128-132+140(in Chinese)(易荣武, 王爱民. 手指远程康复训练机器人系统设计[J].电子测量技术, 2016, 39(9): 128-132+140)[4] Poupyrev I, Ichikawa T, Weghorst S, et al. Egocentric object。

2023-2024学年全国全部科粤版(粤教版)初中化学同步练习(含解析)

2023-2024学年全国初中化学同步练习考试总分：110 分考试时间： 120 分钟学校：__________ 班级：__________ 姓名：__________ 考号：__________注意事项：1．答题前填写好自己的姓名、班级、考号等信息; 2．请将答案正确填写在答题卡上;卷I （选择题）一、选择题（本题共计 3 小题，每题 3 分，共计9分）1. 一定质量的样品高温煅烧，若样品分解了，则剩余固体中含元素的质量分数为A.B.C.D.2. 如下图是某物质在一定条件下发生分解反应的微观示意图（用“”表示氢原子，用“”（表示氧原子），下列说法不正确的是（）A.反应中未发生改变的粒子为分子B.反应的方程式为C.实验室用该方法制取氧气绿色环保D.甲与丙化学性质不同的原因是分子构成不同3. 下列化学方程式符合题意且书写正确的是（）A.正常雨水呈弱酸性的原因：B.用水的电解实验测定水的组成：C.用稀盐酸除去铜粉中少量的铁粉：D.用含氢氧化镁的药物治疗胃酸过多症：卷II （非选择题）CaCO 375.0%Ca 53.3%71.4%59.7%34.6%22O +↑H 2O 2===MnO2H 2O 2+O =SO 2H 2H 2SO 32O =2+H 2H 2O 22Fe +6HCl =2+3FeCl 3H 2Mg +2HCl =+2O (OH)2MgCl 2H 2二、填空题（本题共计 2 小题，每题 3 分，共计6分）4. 浓硝酸是一种具有强氧化性的酸，可以和铜在常温条件下反应生成二氧化氮、硝酸铜及一种常温下呈液态的物质，该反应的化学方程式为______________________________________。

将铜和碳的混合物在氧气中充分灼烧、冷却、称量，发现剩余固体的质量仍，则该混合物中碳的质量分数为________。

5. 过氧化钠可用作防毒面具等的供氧剂，其原理是与反应生成碳酸钠和氧气，反应的化学方程式为_______________________________；将和的混合气体通过足量的，固体质量增加了，则原混合气体中和的质量比为________。

2022年海南省普通高中学业水平合格性考试化学(真题)试卷含详解全文

2022海南省普通高中学业水平合格性考试化学试卷注意事项：1.本试卷分为第I卷(选择题)和第Ⅱ卷(非选择题)两部分。

全卷满分100分，考试时间60分钟。

答卷前，考生务必在试卷和答题卡指定位置填写本人姓名和准考证号，在答题卡上粘贴条形码。

2.选择题的答题，使用2B铅笔将所选答案标号方框涂黑。

如果修改答案，应使用橡皮将错选项方框涂点擦干净后，并将改选项的方框涂黑。

3.非选择题的答题，使用黑色签字笔在题号指定区域作答，在题号指定区域以外以及草稿纸、试卷上作答无效。

4.考试结束后，将本试卷和答题卡一并交回。

可能用到的相对原子质量：H1C12O16Ca40第I卷选择题本卷共有35小题，1～25题每小题2分，26-35题每小题3分，共80分。

在每小题给出的四个选项中，只有一个符合题意。

1．下列举措不符合“减碳在行动”的是A．发展新能源产业B．加强CO2利用的研究C．倡导低碳化出行D．促销燃油汽车保经济2．能根据食品科学、营养学和医学专业知识，结合服务对象的特殊需求进行膳食指导的职业是A．化工工程师B．营养师C．环保工程师D．测试工程师3．下列药物功能主治是解热镇痛的是A．维生素C B．胃舒平C．阿司匹林D．钙尔奇4．“安全无小事”。

下列化学品运输用的标识为“腐蚀品”的是A．苯B．浓硫酸C．汽油D．天然气5．能出现丁达尔效应的分散系是A．食盐水B．泥浆水C．Fe(OH)3胶休D．FeCl3溶液6．民间称硒(Se)为“长寿”元素。

7934Se原了核内质子数为A．34B．45C．79D．1137．“84”消海液的有效成分NaClO属于A．酸B．碱C．盐D．氧化物8．古籍《齐民要术》中描述了腊肉的制作：“用牛、羊…之精者，破作片…以冷水淘白盐…浸。

再宿，出，阴干。

”其中“白盐”的作用是A．防腐剂B．着色剂C．抗氧化剂D．营养强化剂9．我国的超级钢研究居于世界领先地位。

某超级钢含下列4种元素，共中属于非金属的是A．锰B．碳C．铝D．钒10．配制100mL1.00mol/L NaCl溶液必需的仪器是A．B．C．D．11．下列关于Na2O2的叙述错误的是A．属于共价化合物B．固体呈淡黄色C．与水反应产生气泡D．可在呼吸面具中作为O2来源12．一定条件下的密闭容器中，发生可逆反应N2+3H2 2NH3，下图中a、b、c、d四个时刻达到了平衡状态的是A．a B．b C．c D．d13．以下做法不利于我省实现“生态立省”目标的是A．实施“禁塑令”B．倡导垃圾分类C．燃放节日烟花D．严控废水排放14．下列物质能从海水中直接获得的是A．镁单质B．溴单质C．钾单质D．氯化钠15．下列物质中硫元素化合价最低的是()A．S B．SO2C．H2SO4D．H2S16．下列各组烃互为同分异构体(具有相同的分子式，但结构不同)的是A．B．C．D．17．以下变化中没涉及氧化还原反应的是A．食物腐败B．燃料燃烧C．钢铁生锈D．干冰升华18．实验室处理尾气中的氯气，方法合理的是A．硫酸吸收B．碱液吸收C．燃烧除去D．直接排放19．打开充满NO的集气瓶，瓶口出现红棕色(2NO+O2=2NO2)。

基于NODE-UNet++和标记分水岭算法的红细胞图像分割

第37卷第9期2022年9月Vol.37No.9Sept.2022液晶与显示Chinese Journal of Liquid Crystals and Displays基于NODE-UNet++和标记分水岭算法的红细胞图像分割荣亚琪1，2，张丽娟2，崔金利3，苏伟4，盖梦野1*（1.吉林农业大学信息技术学院，吉林长春130118；2.长春工业大学计算机科学与工程学院，吉林长春130012；3.长春中医药大学附属医院医药影像科，吉林长春130000；4.长春中医药大学医药信息学院，吉林长春130117）摘要：对血液涂片图像中的红细胞进行精确分割是一项重要的技术，也是一个难题，主要是因为红细胞经常重叠，没有明显边界。

针对此问题，本文提出一种基于U-Net++和神经常微分方程（Neural Ordinary Differential Equations，NODE）的深度学习网络NODE-UNet++用于红细胞的初步分割，再利用标记分水岭算法分割血液涂片图像中的粘连红细胞。

首先对图像进行裁剪和标注，突出待分割区域；然后应用新的语义分割体系结构NODE-UNet++对预处理后的图像进行初始分割得到概率灰度图；最后采用标记分水岭算法将灰度图中的粘连红细胞分离，得到最终红细胞分割结果图。

实验结果表明，Dice系数达到96.89%、平均像素准确率达到98.97%、平均交并比达到96.33%。

通过对不同血液涂片图像的分割结果表明，该方法能高效精确地提取每个红细胞，满足后续红细胞图像处理的需求。

关键词：图像分割；红细胞；神经常微分方程；标记分水岭算法中图分类号：TP391文献标识码：A doi：10.37188/CJLCD.2022-0009Red blood cell image segmentation based onNODE-UNet++and marker watershedRONG Ya-qi1，2，ZHANG Li-juan2，CUI Jin-li3，SU Wei4，GAI Meng-ye1*（1.School of Information Technology，Jilin Agricultural University，Changchun130118，China；2.School of Computer Science and Engineering，Changchun University of Technology，Changchun130012，China；3.Department of Radiology，Affiliated Hospital of Changchun University of Chinese Medicine，Changchun130000，China；4.College of Medicine Information，Changchun University of Chinese Medicine，Changchun130117，China）Abstract：Accurate segmentation of red blood cell（RBC）from blood smear images is an important technique 文章编号：1007-2780（2022）09-1190-09收稿日期：2022-01-15；修订日期：2022-02-25.基金项目：国家自然科学基金（No.61806024）；吉林省教育厅科学研究项目（No.JJKH20210747KJ，No.JJKH20200678KJ）；吉林省生态环境科学研究项目（No.202107）Supported by National Natural Science Foundation of China（No.61806024）；Scientific Research Project ofJilin Provincial Department of Education（No.JJKH20210747KJ，No.JJKH20200678KJ）；Ecological Envi‐ronment Scientific Research Project of Jilin（No.202107）*通信联系人，E-mail：mengyeg@第9期荣亚琪，等：基于NODE-UNet++和标记分水岭算法的红细胞图像分割and a difficult problem，mainly because RBCs often overlap and have no distinct boundaries.To solve this problem，a deep learning network called NODE-UNet++is proposed，which is based on U-Net++and neural ordinary differential equations（NODE）.It is mainly used for pre-segmentation of RBCs，and then the marker watershed algorithm is adopted to segment clustered RBCs from blood smear images.Firstly，an image is clipped and labeled to highlight the region to be segmented.Then，a new semantic segmentation architecture NODE-UNet++is applied for pre-segmentation of the preprocessed image to obtain the probability grayscale image.Finally，the marker watershed method is used to separate the clustered RBCs in the grayscale image to obtain final RBC segmentation result.The experimental results show that the Dice similarly coefficient is96.89%，the mean pixel accuracy is98.97%，and the mean intersection over union is 96.33%.Segmentation results of different blood smear images show that the proposed method can extract each RBC efficiently and accurately to meet the requirements of subsequent RBC image processing.Key words：image segmentation；red blood cell；neural ordinary differential equations；marked water‐shed algorithm1引言红细胞是血液中最丰富的血细胞，其主要作用是运输氧气和一部分二氧化碳［1］。

利用网络表征学习辨识复杂网络节点影响力

2021年2月第2期Vol. 42 No. 2 2021小型微型计算机系统Journal of Chinese Computer Systems利用网络表征学习辨识复杂网络节点影响力杨旭华，熊帅(浙江工业大学计算机科学与技术学院，杭州310023)E-mail : xhyang@ zjut. edu. cn摘要：发现复杂网络中最具影响力的节点，有助于分析和控制网络中的信息传播，具有重要的理论意义和实用价值.传统的确定节点影响力的方法大多基于网络的邻接矩阵、拓扑结构等，普遍存在数据维度高和数据稀疏的问题，基于网络表征学习，本文提出了一种局部中心性指标来辨识网络中高影响节点(NLC),首先采用DeepWalk 算法,把高维网络中餉节点映射为一个低维空间的向量表示，并计算局部节点对之间的欧氏距离；接着根据网络的拓扑结构，计算每个节点在信息的传播过程中，对所在局部的影响力大小，用以识别高影响力节点.在八个真实网络中，以SIR 和SI 传播模型作为评价手段，将NLC 算法和度中心性、接近中心性、介数中心性、邻居核中心性、半局部中心性做了对比，结果表明NLC 算法具有良好的识别高影响力传播节点飴性能.关键词：节点影响力；网络表征学习；局部节点中心性;复杂网络中图分类号：TP301文献标识码:A 文章编号:1000-1220(2021)02-0418-06Identiflcation of Node Influence Using Network Representation Learning in Complex NetworkYANG Xu-hua,XIONG Shuai(Computer Science and Technology College,Zhejiang University of Technology ,Hangzhou 310023 .China)Abstract ： Finding the most influential propagation nodes in complex networks is helpful to analyze and control the propagation of in formation in the network , which is of great theoretical significance and practical value. Most of the traditional methods for determining the influence of nodes are based on the adjacency matrix and topology of the network , and the problems of high data dimension and da ta sparsity are common. Based on Network Representation Learning , this paper proposes an algorithm to identify the high influence propagation nodes of the network ( NLC). Firstly ,the deepwalk algorithm is used to map the nodes in a high-dimensional network intoa vector representation of a low-dimensional space and calculate the euclidean distance between local node pairs. Then ,according to thetopology of the network,the influence of each node on the local area during the propagation of information is calculated to identify the high-influence nodes. In eight real networks , SIR and SI propagation models are used as evaluation methods , comparing the NLC algo rithm with degree centrality , closeness centrality , betweeness centrality , neighborhood coreness , and semi-local centrality , the resultsshow that NLC algorithm has good performance in identifying high-influence propagation nodes.Key words : node influence ； network representation learning ； node local centrality ； complex network1引言真实世界中的许多系统都可以抽象为复杂网络，比如社交网络、交通网络、电力网络、通信网络、人物关系网络、流行病传播网络等.辨识网络中有影响力的传播节点，涉及到网络的结构和功能等属性，包括度分布，平均距离，连通性,信息传播，鲁棒性等3〕，在实际应用中，能够控制信息在网络中的传播⑷、做高效的新闻推广⑸、避免电网中故障的传播⑷、分析蛋白质之间的相互作用⑺等.如何有效辨识网络中节点传播影响力的大小，研究者们已经有了不少研究成果，这些方法总体上可以分为两种类型：基于局部信息和基于全局信息的判断节点中心性的方法.基于局部信息的方法，例如：度中心性⑻把节点连接的边的数量作为衡量的指标;邻居核中心性⑼把节点的一级邻居、二级邻居和三级邻居节点个数之和当做判断影响力大小的指标;K-shell 分解方法31,是一种基于节点局部拓扑结构的方法丄iu 等人认为许多真实网络由于局部的紧密连接而存在类核结构，导致许多节点的值不能真实的反映节点在网络中的影响力，他们通过删除冗余边的策略,提高了 K-shell 值的准确性;郑文萍等人衡量节点在网络连通性中的作用，通过节点所连边对局部网络连通性的影响来反映该节点在网络连通性方面的重要性;Chen 等人口结合度中心性和全局信息，提出了一种半局部中心性方法，实验表现与紧密中心性相同,但计算复杂度较低;李维娜等人,基于网络的局部社团结构和节点度的分布情况，提出了一种重要节点挖掘算法SG-CPMini n &基于网络全局信息的方法往往能获得比基于局部信息的算法更高的精确度，但计算复杂度比较高.例如介数中心收稿日期:2020-02-24 收修改稿日期；2020-04-14 基金项目：国家自然科学基金项目(61773348)资助；浙江省自然科学基金项目 (LY17F030016)资助.作者简介:杨旭华，男，1971年生，博士，教授,CCF 会员，研究方向为机器学习、复杂网络、智能交通；熊0巾，男，1994年生，硕士研究生，研究方向为机器学习、复杂网络.2期杨旭华等:利用网络表征学习辨识复杂网络节点影响力419性和接近中心性:冏，都是基于全局路径的方法，考虑网络中任意节点对之间的路径.谷歌公司提出的PageRank"",通过考虑邻居节点的数量和质量,再进行全局的迭代计算来确定节点的重要性.吕琳環等人提出一种类似于PageRank的算法，在网络中增加了一个背景节点与所有节点进行双向连接,使新的网络成为强连通网络，称作LeaderRank").王斌等人(切考虑网络的结构及属性信息，提出节点信任度的概念，同时将节点信任度引入到PageRank算法中，构建了一种关键节点识别算法TPR(Trust-PageRank)；Lu等人画提出了一种基于信息扩散特性，将节点的局部属性与全局属性相结合的WeiboRank(WR)算法，在微博社交网络数据上表现良好.上述辨识方法,都是建立在传统的网络表示方法之上的，普遍依赖于网络的邻接矩阵和拓扑结构，具有维度高和数据稀疏的特点,计算复杂度高，在大型网络使用中计算代价比较高.随着网络表征学习技术在自然语言处理等领域的发展和广泛应用,研究者们转而探索如何将网络中的节点表示为低维且稠密的向量，提岀了诸多方法.DeepWalk是网络表征学习的先驱0),将词表示学习算法word2vec[22]应用在随机游走序列上,从而生成了节点的低维度表示向量.Lineal针对一阶相似度和二阶相似度，提出了一种边采样算法优化目标函数，进而得到节点的向量表示.N o de2vec[241通过改变随机游走序列生成的方式扩展了DeepWalk算法,将宽度优先搜索和深度优先搜索引入了随机游走序列的生成过程,综合考虑了网络的局部信息和全局信息来表示节点•CANE1251假设每个节点的表示向量由文本表示向量及结构表示向量构成，其中，文本表示向量的生成过程与边上的邻居相关，再利用卷积神经网络和注意力机制对一条边上两个节点的文本信息进行编码，得到节点的表示向量■SDNE1261使用深层神经网络对节点表示间的非线性进行建模，把模型分为两个部分:一个是由Laplace矩阵监督的建模第1级相似度的模块，另一个是由无监督的深层自编码器对第2级相似度关系进行建模，将深层自编码器的中间层输岀作为节点的向量表示.这些算法从不同的角度，采用不同的优化方法，把高维和稀疏的网络映射到低维和稠密的向量空间，保留网络的原有结构，具有计算复杂度低和准确度高等特点.在本文中，我们基于网络表征学习提出了一种辨识网络节点影响力的方法.采用网络表征学习DeepWalk算法把高维的复杂网络映射到低维的向量空间，把网络节点映射为欧式空间中低维的向量表示，然后结合网络拓扑信息提出节点的局部中心性，作为判断节点影响力大小的指标.2基于网络表征学习的节点局部中心性节点在网络中传播信息时,与其局部的拓扑结构有很大的关系.已有研究表明：节点的K-shell值越大，周围的拓扑结构越紧密，节点向周围区域传播信息的效率越高〔勿，同时，信息传递的强度随着节点间距离的增大而迅速衰减皿)，由此,提出一种基于网络表征学习和局部中心性确定任意节点i的影响力指标：NLC(i)=Z心X e-')Ti-X/2(J)其中,Ks,■表示节点i的K-shell值必”分别表示节点ij用DeepWalk网络表征方法映射到低维欧式空间的向量，比-X」表示两个向量之间的欧氏距离，r(i)表示i节点的三级邻域，即i节点的一级邻居、二级邻居以及三级邻居节点的集合j节点属于r(i)集合.网络中节点间的距离，本文没有采用网络的最短路径距离，因为会存在如下的问题，如图1所示,i节点在传播它自身的信息时，首先会影响它的一级邻居节点，比如节点k和节点j,当节点A和/被感染后，由于j节点有更多的连接到外部区域的邻居节点(图1中灰色节点)，尽管同样是节点i的一级邻居节点J比k在传播i节点信息的过程中贡献更大【切，所以，信息在网络中的传播,除了距离以外，还与网络的结构密切相关，最短路径距离的长度不能准确的表示信息在传播过程中的衰减，还要根据网络的拓扑结构，对所求节点的邻域节点做进一步的划分.因为网络表征学习方法不但可以把高维网络映射到低维的向量表示，而且可以同时保持网络的结构，节点间的距离用低维向量间的欧式距离替代后，不仅考虑了最短路径距离，而且包含了图1一个有8个节戌和节点周围的拓扑结构信息，能够9务边的网络更准确的描述信息在网络传播过Fig.1Nitwork with eight程中的衰减因此在本文中，我们....选择应用DeepWalk方法，把网nodes and nine edges络节点映射到低维的向量表示，然后用节点相应的低维向量来计算节点之间的距离.具体地，基于DeepWalk方法，将网络空间映射到欧式空间,把每一个节点表示为一个低维稠密的向量，将具有N个节点的网络G转化为欧氏空间的N个r维向量，一个网络节点及其连边信息对应一个向量，其中任意节点i的向量表示为：Xi=(x.l,X.2,X.3，…，x.,),i=1,2,3,,N,在本文中，『取N/23实验和分析3.1数据集为了评估所提出的方法的性能,我们在8个真实世界的网络中进行了实验，这8个网络都是无向网络，也不考虑权重,它们分别是常见形容词和名词的邻接网络adjnoun f30]、科学家合作网络netscience、Ca-GrQc和hep-th[31H]、新西兰宽吻海豚社会网络dolphin1341、小型的facebook社交网络、爵士音乐人合作网络Jazz匈、美国政治图书网络polbooks1371,表1给出了8个真实数据集的拓扑属性参数.其中,N和E分别表示网络的节点数和边数，〈&〉表示网络的平均度，在本文中，考虑到现实世界中网络的度分布往往存在“重尾效应”，令0”=<*>/<*2>[381，表示SIR模型传播的阈值,c表示网络的平均聚类系数.3.2评价方法和指标3.2.1SIR疾病传播模型SIR属于动态传播算法，结果准确性好但计算复杂度高,420小型微型计算机系统2021年本文提出的NLC算法及其他静态指标方法计算复杂度低，我们用SIR疾病模型做为基准参照模型去评价不同的判断节点影响力静态指标方法性能的优劣（列.在SIR模型中，如果需要判定一个节点在网络中的传播影响力，则把这个节点设定为网络中唯一的感染节点（Infected）,其他节点标记为易感节表1数据集Table1Data setsNetwork N E〈k〉cdolphin62159 5.130.1470.27polbooks1054418.40.0840.488Jazz198274227.700.0260.617adj n oun1124257.5890.0730.1728 netscience15892742 3.4510.1440.6378 facebook40398823443.6910.0090.6055 Ca-GrQc524214496 5.5310.05930.5296 hep-th836115751 3.7680.1150.4420点（Susceptible）,在每个时间步，每个感染态节点会以概率0（0=1.50*）感染其易感邻居节点,0”表示SIR模型传播的阈值,然后以概率“（在本文中，我们设置“=1）从疾病中恢复，变成移除态（Recovered）,移除态节点不会再被感染.这个过程不断迭代直到网络中没有感染节点为止,r时刻网络中移除态和感染态节点的总数量，记为F（r）,F（r），作为评价r时刻该节点传播影响力大小的指标,F（r）越大,该节点影响力越大. 3.2.2SI疾病传播模型在该模型中，节点一旦被感染,状态从S变为I之后不能恢复，其他条件和SIR模型相同，在本文中，易感状态节点被感染的概率为苹".如果在相同的时间步的条件下，一个节点感染的网络节点越多，则说明该节点感染能力越强,影响力越大.3.2.3肯德尔系数不同的方法都可以按照所计算的传播能力，对网络中所有节点从高到低排序，针对不同的感染率0,我们用肯德尔系数7去评价不同的静态指标方法得到的排序列表和SIR动态传播模型生成的排序列表之间的联系I切，t是一个在[-1, 1]之间的一个数,7■越大，两个序列吻合度越高,T被定义为：2(M-NJN(N-1)(2)N c表示两个排序列表相协调元素的数量,M表示二者不协调元素的数量,N表示网络节点总数.3.3数值仿真首先,对八个真实网络的每一个节点在本网络内赋予唯一的编号，比如网络1有N个节点，则网络节点的编号应该是1,2,……,N.3.3.1比较NLC和5种知名中心性方法识别的Top-10高影响力节点的准确性在表2中,我们以SIR模型计算出来的Top-10节点为基准，在4个真实网络上，用NLC方法，度中心性（DC）、接近中心性（CC）、介数中心性（BC）、邻居核中心性（Cnc）、半局部中心性（CL）分别计算ToplO节点，比较不同方法的准确性,考虑到网络的规模和时间复杂度,本文令『=10[41].具体计算方法为:以dolphin网络为例,首先用SIR模型在t=10时刻，计算得到F（10）数值最大的Top-10节点做为基准，然后用NLC方法算出Top-10节点，如果两组节点有9个相同，则NLC算法的准确率为90%.表26种中心性算法和SIR模型对排名前10节点的识别结果Table2Six algorithms and SIR modelsto identify thetop-10nodes网络dolphin算法（准确率）排序DC(70%)BC(60%)cc(60%)Cnc CL(80%)(80%)NLC(90%)F(10) 1153737151515152382414638383834641383846412143438213434214155281521413746618182303046377212184151342830552952525130958523422125110258958173052网络adj n oun算法（准确率）排序DC(70%)BC(60%)CC Cnc CL(70%)(80%)(80%)NLC(80%)F(10) 11818181818181823333352334444525252352452524444444444510510281051051051056108010525512851725105105125101082828272826252592622510552655102292619325160网络polbooks算法（准确率）排序DC(80%)BC(60%)CC Cnc CL(40%)(70%)(90%)NLC(90%)F(10) 193131999921350591313131334108858531734851350473410573731073747346677777743110317744153148585831597367676774912954112745104183248741212网络netscience算法（准确率）排序DC(30%)BC(30%)CC Cnc(20%)(40%)CL(0%)NLC(80%)F(10) 134797934143034552351512823514313556337951715163143255344552827575564656335529521730291714332821336143035152914143413354714317573554143513475781432302132120214361351359631337602951437562762102172041124220143854562在表2中，比较其它5种方法，本文提出的NLC算法在4个数据集中都取得了最高的准确率.接下来，我们比较了各种2期杨旭华等:利用网络表征学习辨识复杂网络节点影响力421静态指标算法与SIR模型得到的Top-10节点排序列表的吻合程度，在小型网络polbooks和adjnoun中,6种中心性算法都有较高的准确率,CL算法和NLC算法有相同的准确率，但NLC得到的序列与SIR模型给出的序列更吻合；在dolphin 和netscience网络中,NLC算法不仅有最高的准确率,而且给出的排序序列与SIR模型给出的序列更吻合；就整体而言，NLC与SIR模型得到的序列保持良好的吻合度.其中实验结果取1000次实验的平均值，最佳准确率用黑体字标出,F(10)表示SIR模型在第10时间步的结果.3.3.2比较NLC与5种知名中心性方法在SIR模型下餉肯德尔系数分别用各种静态指标算法与SIR模型对一个网络中所有节点的影响力排序，然后比较各种静态指标算法得到的节点排序列表和SIR模型得到列表的吻合程度，我们用肯德尔系如图2所示，针对不同的感染率B，使用NLC和5种知名中心性方法计算出网络中所有节点的影响力大小排序列表，与SIR模型生成的排序列表做对比，得到肯德尔系数T.在adjnoun网络中,BC算法表现最差,CL和Cnc算法表现基本相同，NLC算法表现最好；在polbooks网络中，CC和BC 表现最差,NLC、CL、Cnc表现良好;在netscience网络中，表现最差的还是BC算法,CC和CL算法也表现不佳，当B< 0.04.NLC算法表现最好，总体表现良好;在facebook网络中,CC表现最差，当p>0.04,NLC表现最好;在hep-th网络中，当B<0.04时,NLC算法表现最好，当p>0.04,NLC算法在6种方法中排名第二；dolphin网络中，当B在0到0.04以及0.07到0.1这两个区间时,NLC算法表现最好，优于其它算法;在Jazz和Ca-Grtjc网络中，BC算法表现最差，当B >0.03时,NLC算法表现最好;综上所述,NLC在肯德尔系数表示这个吻合程度.0.80数上表现最佳.netscienceinounb0.70l0.60.650.60NLC CC BC DC CL Cnc00.020.04 0.06 0.080.100.020.040.060.080.103NLC CC BC DC CL Cnc图2NLC,8,BC,DC,CL,Cnc算法的肯德尔系数，取1000实验的平均值.横坐标表示节点被感染的概率，纵坐标表示肯德尔系数Fig.2Kendall correlation coefficient of NLC,CC,BC,DC,CL,Cnc algorithm which are taken as the average value of1000 experiments.The horizontal ordinate represents the probability of the node being infected,and the longitudinalordinate represents the Kendall correlation coefficient3.3.3比较NLC和CL、Cnc方法■所选Top-10节点的平均感染能力在8种不同的网络中.NLC算法性能均排前列;BC和CC 算法不仅计算量大,而且表现差;Cnc算法和CL算法,在不同的数据集中,表现极不稳定,在有些数据集中表现较好,在有些数据集中甚至差于BC和CC算法.为进一步比较NLC.CL以及Cnc算法的性能，我们使用SI模型检验3种算法性能.首先用一个算法选出Top-10节点，然后用Top-10节点在第r个时间步之内感染的节点总数与网络节点总数的比值的平均值I(t)诰(3)422小型微型计算机系统2021年做为该算法的性能指标•在式(3)中，n表示网络节点总数,％，表示Top-10节点中第i个节点第1到第r步感染的节点总数.在相同的时间步和感染概率的情况下,哪一种方法选出的Top-10节点感染的节点越多，可以认为该算法表现越好.具体实验结果如图3所示，可以看到，NLC算法在4个网络中都取得了最佳性能.在dolphin网络中，NLC算法表现最好,Cnc算法性能最差;在netscience网络中，当时间步大于15后,NLC算法感染的节点比另外两种算法明显增多，达到稳定的时间也比另外两种算法早，所选Top-10节点表现最好Ca-GrQc网络中，时间步小于10时,3种算法表现相近，大于10后,NLC算法表现最好，且NLC算法在第33个时间步就达到稳定;在hep-th网络中，Cnc算法表现最差，在第42个时间步才达到稳定,NLC算法表现最好.(d)©图3Top-10节点的感染能力和时间步的关系曲线，取1000次实验的平均值.横坐标表示时间步，纵坐标表示第t个时间步内Top-10节点在SI模型中感染的节点数的平均值与网络节点总数的比值Fig.3Relationship curve of infection ability and time step of Top-10node.The results are taken the average of1000experiments, the horizontal ordinate represents the time step,and the longitudinal ordinate represents the ratio of the average number of nodes infected by Top-10nodes in the SI model to the total number of network nodes within the t time step4总结和分析在本文中,我们基于网络表征学习方法，结合节点的拓扑结构和邻域信息,提出了一种节点局部中心性指标来识别节点影响力的方法•该方法提出网络中的节点的影响力由拓扑结构决定，同时随着距离的增加而衰减•在8个真实网络中，通过和5种知名的中心性方法相比较，在计算Top-10节点、Top-10节点的感染能力和肯德尔系数等方面,NLC算法取得了良好的辨识效果，在分析和控制复杂网络中的信息传播过程中具有广阔的应用前景.References:[1]Albert R,Barabasi A L.Statistical mechanics of complex networks[J].Review of Modem Phy s ics,2001,74(1)：47-97.[2]Boccaletti S,Latora V,Moreno Y,et plex networks:structure and dynamics[J].Complex Systems and Complexity Science, 2006,424(4-5):175-308.[3]Newman M E J.The structure and function of complex networks[J].Siam Review,2003,45(2)：167-256.[4]Wells C R,Galvani A P.Coupled disease-behavior dynamics oncomplex networks:a reviewf J].Physics of Life Reviews,2015,62(15)：55-56.[5]Medo M,Zhang Y C,Zhou T.Adaptive model for recommendationof news[J].Europhysics Letters,2009,88(3)：42-51.[6]Albert Reka,Albert Istvdn,Nakarado G L.Structural vulnerabilityof the North American power grid[J].Physical Review E,2(X)4,69(2):59-73.[7]Li Min,Meng Xiang-mao.The construction,analysis,and applications of dynamic protein-protein interaction networks[J].Journal of Computer Research and Development,2017,54(6):1281-1299.[8]Bonacich P F.Factoring and weighting approaches to status scoresand clique identification[J].Journal of Mathematical Sociology, 1972,2(1)：113-120.[9]Bae J,Kim S.Identifying and ranking influential spreaders in complex networks by neighborhood coreness[J].Physica a Statistical Mechanics&Its Applications,2014,395(4)：549-559.[10]Dorogovtsev S N,Goltsev A V,Mendes J F F.K-core organizationof complex networks[J].Physical Review Letters, 2006,96(4)：40601.1-40601.4.[11]Liu Y,Tang M,Zhou T,et al.Improving the accuracy of the k-shell method by removing redundant links:from a perspective of spreading dynamics[J].Scientific Reports,2015,5(2)：33~46. [12]Zheng Wen-ping,Wu Zhi-kang,Yang Gui.A novel algorithm for i2期杨旭华等:利用网络表征学习辨识复杂网络节点影响力423dentifying critical nodes in networks based on local centrality[J].Journal of Computer Rresearch and Development,2019,56(9)：1872-1880.[13]Chen D,Lii L,Shang M S,et al.Identifying influential nodes incomplex networksf J].Physica a Statistical Mechanics&Its Applications,2012,391(4)：1777-1787.[14]Li Wei-na,Ren Jia-dong.Key node mining in complex softwarenetwork[J].Journal of Chinese Computer Systems,2018,39(9)：2022-2028.[15]Freeman L C.A set of measures of centrality based on betweenness[J].Sociometry,1977,40(1)：35-41.[16]Sabidussi G.The centrality index of a graph[J].Psychometrika,1966,31(4):581-603.[17]Brin S,Page L.The anatomy of a large-scale hypertextual websearch engine[J].Computer Networks&Isdn Systems,1998,30(2):16-34.[18]Lii L,Zhang Y C,Yeung C H,et al.Leaders in social networks,thedelicious case[J].Pios One,2011,23(6)：1-13.[19]Wang Bin,Wang Ya-yun,Sheng Jin-fang,et al.Identifying influential nodes of complex networks based on trust-value[J].Journal of Chinese Computer Sy s tems,2019,40(11)：2337-2342.[20]Jing L,Wanggen W.Identification of key nodes in microblog net-works[J].Etri Journal,2016,38(1):52-61.[21]Perozzi B,Al-Rfou R,Skiena S.Deepwlk:online learning of socialrepresentations[C]//ACM Sigkdd International Conference on Knowledge Discovery&Data Mining,2014.[22]Mikolov T,Sutskever I,Chen K,et al.Distributed representationsof words and phrases and their compositionality[J].Advances in Neural Information Processing Systems,2013,26(2)：3111-3119.[23]Jian T,Meng Q,Wang M,et al.LINE:large-scale information network embedding[C]//24th International Conference on World Wide Web,WWW2015,2015.[24]Aditya Grover J L.node2vec:scalable feature learning for networks[CJ//ACM Sigkdd International Conference on Knowledge Discovery&Data Mining,2016.[25]Tu C C,Liu H,Liu Z Y,et al.CANE:context-aware network embedding for relation modeling[C]//Proceedings of the55th Annual Meeting of the Association for Computational Linguistics,Van-couve,2017：1722-1731.[26]Wang D,Cui P,Zhu W.Structural deep network embedding]C]//Proceedings of the22n d ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,San Francisco,2016：1225-1234[27]Kitsak M,Gallos L K,Havlin S,et al.Identification of influentialspreaders in complex networks[J].Nature Phy s ics,2010,6(11)：888-893.[28]Ma L L,Ma C,Zhang H F,et al.Identifying influential spreaders incomplex networks based on gravity formula[J].Physica a Statistical Mechanics&Its Applications,2016,451(3)：205-212.[29]Liu Y,Tang M,Do Y,et al.Accurate ranking of influential spreaders in networks based on dynamically asymmetric link-impact[J].Physical Review E,2017,96(2)：1-1,doi：10.1103/PhysRevE.96.022323.[30]Newman M E J.Finding community structure in networks using theeigenvectors of matrices[J].Physical Review E,2006,74(3)：51-66.[31]Newman M E J.The structure of scientific collaboration networks[J].Proceedings of the National Academy of Sciences of the United States of America,2001,98(2)：404-409.[32]Leskovec J,Kleinberg J,Faloutsos C.Graph evolution:densifica-tion and shrinking diameters[M].Association for Computing Machinery,ACM,2007.[33]Duncan J Watts,Steven H.Strogatz.Collective dynamics of smallworld networks[J].Nature,1998,393(6684)：440-442.[34]Newman M E J,Watts D J,Strogatz S H.Random graph models ofsocial networks[J].Proceedings of the National Academy of Sciences'^,99(Sup)：2566-2572.[35]McAuley J,Leskovec J.Learning to discover social circles in egonetworks[C]//Conference and Workshop on Neural Information Processing Systems(NIPS),2012.[36]Maridn Bogufid,Pastor-Satorras R,Albert Diaz-Guilera,et al.Models of social networks based on social distance attachment[J].Physical Review E Statistical Nonlinear&Soft Matter Physics, 2004,70(2):2441.[37]Fatiha Souam,Ali Aitelhadj,Riadh Baba-Ali.Dual modularity optimization for detecting overlapping communities in bipartite networks [J].Knowledge&Information Systems,2014,40(2)：455-488. [38]Li Rui-qi,Wang Wei,et al.Review of threshold theoretical analysisabout epidemic spreading dynamics on complex networks[J].Complex Systems and Complexity Science,2016,13(1)：l-39. [39]Garas A,Argyrakis P,Rozenblat C,et al.Worldwide spreading ofeconomic crisis[J].New J Phys,2010,12(11)：69-73.[40]Kendall M G.A new measure of rank correlation[J].Biometrika,1938,30(1-2)：81-93.[41]Wang S,Du Y,Deng Y.A new measure of identifying influentialnodes:efficiency centrality[J].Communications in Nonlinear Science and Numerical Simulation,2017,47(6)：151-163.附中文参考文献:[7]李敏,孟祥茂•动态蛋白质网络的构建、分析及应用研究进展[J].计算机研究与发展,2017,54(6):1281-1299.[12]郑文萍，吴志康，杨贵•一种基于局部中心性的网络关键节点识别算法[J]•计算机研究与发展,2019,56(9):1872-1880. [14]李维娜，任家东•复杂软件群体网络社团中关键节点挖掘算法[J].小型微型计算机系统,2018,39(9):2022-202&[19]王斌，王亚云,盛津芳，等•基于节点信任度的复杂网络关键节点识别[J]•小型微型计算机系统,2019,40(11)：2337-2342.。

微项目式学习在高考化学复习中的应用——以《无机工艺流程题》为例

·180·
2021 年 1 月第 48 卷第 1 期
云南化工 Yunnan Chemical Technology
Jan.2021 Vol.48，No.1
表 2 微项目方案设计与实施——2020 年全国Ⅲ卷的化工流程题
驱动问题
任务解决与展示
设计说明
问题 1 ：该流程的原料与产【阅读流程】该流程的原料是废镍催化剂，含金属镍、铝、铁及其氧化物，还明确流程的原料与产物，确定哪些
微项目学习的过程充分体现了学生学习的主体地位。在教学中，学生是学习的主体，教师只有不断的创设情景去激发学生的学习兴趣，才能调动学生学习的积极性，发挥出学生的主体地位。怎样创设情景是一个值得思考的问题，情景要与本节课的知识内容相符合，同时还要能够激发学生学习的积极性，较其他
·179·
2021 年 1 月第 48 卷第 1 期
物是什么？
有少量其他不溶性物质，产物是硫酸镍晶体。
物质是杂质，便于解题分析
【小组讨论】加入 NaOH 可以除去油脂，且 NaOH 能和原料中的杂质发生如依据流程图进行设问，这个步骤属
问题 2 ：该流程图中第一次下反应 2Al+2NaOH+2H2O=2NaAlO2+3H2 ↑、2Al2O3+4NaOH=4NaAlO2+2H2O，于对原料的预处理环节，在学生分
关键词：微项目式学习；二轮复习；无机工艺流程中图分类号：G633.8 文献标识码：A 文章编号：1004-275X（2021）01-179-03
The Application of Microitem Learning in Chemistry Review of College Entrance Examination

北京协和医院检验科报告不正确率分析及持续改进

管理教学北京协和医院检验科报告不正确率分析及持续改进∗刘文静１,２,秦绪珍１,孙丹丹１,吴㊀卫１,夏良裕１,程歆琦１,王㊀瑶１,吴㊀洁１,杜㊀娟１,赵㊀芳１,李鹏昌１,邱㊀玲１,２ә１．中国医学科学院北京协和医院检验科,北京１００００５;２．北京市侵袭性真菌病机制研究与精准诊断重点实验室,北京１００７３０㊀㊀摘㊀要:目的㊀通过动态采集并分析检验报告不正确率数据,客观评估检验报告质量水平,采取针对性措施,实现持续质量改进.方法㊀设计实验室信息系统(L I S系统)程序,自动标识检验报告单取消审核的动作并记录相关信息,每月按临床检验专业组自动调取㊁统计数据,由指定负责人分析数据,查找并解决问题,持续改进.年度内审及管理评审中分析数据动态变化,评估改进措施的效果,并指定进一步的改进策略.分析２０１４２０１９年检验报告不正确率趋势.应用６σ质量管理方法分析２０１８年和２０１９年检验报告不正确相关因素持续改进的效果.结果㊀２０１４２０１９年科室检验报告不正确率整体呈下降趋势.检验报告不正确率与各组及个人绩效相关联后,检验报告不正确率从２０１８年０．１４０５％下降为２０１９年０．１１１７％,s i g m a水平从４．４８上升到４．５５.检验报告不正确主要原因中操作错误占首位,操作错误㊁流程错误㊁患者信息错误改进明显,２０１８年与２０１９年比较,差异有统计学意义(P＜０．０５);结果不正确和标本质量错误改进不明显,２０１８年与２０１９年比较,差异无统计学意义(P＞０．０５).仪器和试剂故障２０１９年较２０１８年有所增加,差异有统计学意义(P＜０．０５),是后续持续改进的重点.结论㊀检验报告不正确率的降低不仅体现了检验科专业技术水平,同时也反映了科室的管理水平,及时进行管控并持续改进,对临床诊疗具有重要意义.关键词:检验报告不正确率;㊀质量指标;㊀持续改进;㊀检验科D O I:１０．３９６９/j．i s s n．１６７３Ｇ４１３０．２０２１．１０．０２７中图法分类号:R１９７．３文章编号:１６７３Ｇ４１３０(２０２１)１０Ｇ１２７１Ｇ０４文献标志码:B㊀㊀«医学实验室质量和能力认可准则»指出质量指标是一组内在特征满足要求程度的度量,可测量一个机构满足用户需求的程度和所有运行过程的质量[１].质量管理体系规定检验科应定期对所有的运行程序进行系统评审.通过对影响检验服务质量的关键指标进行监测,以达到持续改进检验质量的目的.关键指标覆盖了实验室分析前㊁分析中㊁分析后的全过程[２],２０１６年更新的质量指标模型(MQ I)指出,实验室分析后质量指标包括周转时间㊁危急值通报率㊁检验报告不正确率及解释性注释有效率[３].关键指标按月导出㊁汇总并观察指标的变化趋势,分析当前存在的主要问题㊁潜在问题及发生问题的原因,提出有针对性的改进计划,在常规工作中运行该计划,并评价其合理性,对仍不满意的部分可遵循P D C A(P l a n－计划㊁D o－执行㊁C h e c k－检查和A c t i o n－处理)循环的原则,进行不断地改进.现将中国医学科学院北京协和医院自２０１４年实验室信息管理系统(L I S系统)系统化管理以来对检验报告不正确率的管理及持续改进结果汇总如下.１㊀资料与方法１．１㊀检验报告不正确率[２]㊀检验报告不正确是指实验室已发出的报告,其内容与实际情况不符合,包括结果不正确㊁患者信息不正确㊁标本信息不正确等.检验报告不正确率是指实验室发出的不正确检验报告数占同期检验报告总数的比例.通过L I S系统直接采集２０１４２０１９年检验报告相关数据,包括每月总报告单数及标记过取消审核的报告单数,取消审核报告数等同于检验报告不正确数.计算公式:检验报告不正确率(‱)＝实验室发出的不正确检验报告数/同期检验报告总数ˑ１０４.１．２㊀数据分析及改进计划㊀每月检验报告不正确率录入检验科质量汇总分析报告(月度表) ,判定是否接受(未接受变红 ,需启动P D C A),与上月比较(绿色箭头代表改进,红色箭头代表倒退),计算全科及各专业组检验报告不正确率,同时导出取消审核报告记录明细表.各专业组分析取消审核明细表 ,分析原因,质量负责人与质量小组共同商讨给出有效改进措施,必要时也可重新评估标准.１．３㊀应用６σ质量管理方法分析２０１８２０１９年检验报告不正确相关因素持续改进的效果㊀根据检验报１７２１国际检验医学杂志２０２１年５月第４２卷第１０期㊀I n t J L a bM e d,M a y２０２１,V o l．４２,N o．１０∗基金项目:北京市临床重点专科医学检验科卓越项目(Z K２０１０００).ә㊀通信作者,EＧm a i l:l i n g q i u b j＠a l i y u n．c o m.㊀㊀本文引用格式:刘文静,秦绪珍,孙丹丹,等．北京协和医院检验科报告不正确率分析及持续改进[J]．国际检验医学杂志,２０２１,４２(１０):１２７１Ｇ１２７３．告不正确率换算出每百万分之缺陷数(D P M),并查表可得到相应的s i g m a值.计算公式为:检验报告不正确率D P M＝实验室发出的不正确检验报告数/同期检验报告总数ˑ１０６.１．４㊀统计学处理㊀采用S P S S２２．０统计软件进行数据处理及统计学分析,计数资料以例数或百分率表示,组间比较采用χ２检验.以P＜０．０５为差异有统计学意义.２㊀结㊀㊀果２．１㊀检验报告不正确的几个因素及相应改进措施㊀持续改进过程中发现导致检验报告不正确的主要因素及相应的改进措施,见表１.表１㊀㊀导致检验报告不正确的主要因素及相应改进措施类型内容改进措施操作错误因检测错误㊁数据录入或分析错误等而导致的结果重复;补充或修改备注;多做或少做项目;L I S延时或传输导致的错误.加强组内培训,严格按照项目标准操作程序(S O P)进行检测,审核报告前仔细核对.与L I S沟通加强信息服务系统稳定性建设.流程错误尿液相关检测项目修改或补充尿量,医生要求补加项目.加强与临床医生及护士的沟通,从检验前避免错误的发生;或补加项目重新生成新的标本号,避免取消审核.改进措施:增加临床或患者客户端系统的尿量提示和补录功能.患者信息错误标本类型错误或抽血对象有误,要求更正信息.增加不同院区标本信息二维码系统,避免人为手工录入错误;加强抽血时患者身份识别验证.标本质量错误不合格标本.定期对护理人员进行相关理论培训,每月将全院不合格标本信息情况反馈到护理部,并督促其改进.同时加强检验科工作人员检验前对不合格标本的识别,生化流水线注意观察血清指数,对特殊患者依然要求进行检测的,视具体情况进行报告发放.结果不正确检验报告与既往检查结果或者病情不符,需用其他检测系统进行复测的,医生或患者要求取消审核的报告.加强组内培训,对某些可能存在干扰的特殊标本,用双系统进行检测,并加强小组轮转考核频次.仪器故障包含机器温度㊁部件老化等尚未报警,不易发现的仪器故障.加强仪器设备的维护保养,特别是加强预防性维护保养,定期检查和排除仪器故障隐患.试剂故障加错试剂或因试剂储存不当等导致的错误.加强新瓶及新批次质控和日内多次质控等室内质控措施以及时发现并解决问题.２．２㊀２０１４２０１９年检验报告不正确率持续改进的结果㊀持续改进措施下,２０１４２０１９年全科检验报告不正确率整体呈下降趋势,检验报告不正确率(年平均值)从２９．４１‱下降至１０．５３‱.临检组２０１７年１０月重视该指标后,通过采取在组内加强培训及完善系统提示等措施,２０１８年后能达到科室制订标准.微免组和分子组波动较大.２０１８年１２月科室管审总结会议中提出检验报告不正确率与专业组及个人绩效相关,２０１９年检验报告不正确率与２０１８年相比(除内分泌组外),各专业组均明显下降,下降幅度为１．７６‱~８．３７‱,均在合格限＜２０‱以内(科室制订标准).见表２.表２㊀㊀２０１４２０１９年各专业组检验报告不正确率(‱)年度生化组临检组内分泌组微免组分子组西院合计２０１４年２３．３７３６．５３１５．２５３９．３８３６．２２N A２９．４１２０１５年１５．９２２０．７４６．７０３０．１８１８．９４２１．８４１８．０８２０１６年１４．５６２２．８９８．７３３１．５７２０．４２１４．１６１８．０６２０１７年１４．９８２２．４８７．０８３７．０４１５．７２１４．９４１８．００２０１８年１１．１６１４．７０３．７０２７．４５１８．９２１５．２８１２．８８２０１９年９．４０１２．８７３．７４１９．０８１０．７２７．７７１０．５３㊀㊀注:N A为无数据.２．３㊀２０１８２０１９年检验报告不正确率持续改进的结果㊀将检验报告不正确率与各组及个人医疗绩效相关联作为持续改进的重要措施,用６σ质量管理方法分析２０１８２０１９年导致检验报告不正确相关因素持续改进的效果.２０１８年和２０１９年导致检验报告不正确的７个主要因素所占百分率见表３.操作错误为首位,均在８６％以上.２０１８年与２０１９年检验报告不正确发生率在各因素分布情况比较分析中,除结果不正确㊁标本质量错误外,其他错误类型差异均有统计学意义(P＜０．０５).仪器和试剂故障２０１９年较２０１８年有所增加,差异有统计学意义(P＜０．０５),s i g m a水平２０１９年较２０１８年有所升高,从４．４８上升到４．５５,见表４.表３㊀㊀导致检验报告不正确主要因素构成情况[n(％)]类型２０１８年２０１９年操作错误５６４９(８８．７６)４５５０(８６．７２)流程错误４０７(６．４０)３０４(５．７９)患者信息错误２２０(３．４６)１４５(２．７６)标本质量错误４４(０．６９)９５(１．８１)结果不正确２６(０．４１)５９(１．１２)仪器故障１８(０．２８)７２(１．３７)试剂故障０(０．００)２２(０．４２)合计６３６４(１００．００)５２４７(１００．００)２７２１国际检验医学杂志２０２１年５月第４２卷第１０期㊀I n t J L a bM e d,M a y２０２１,V o l．４２,N o．１０表４㊀㊀２０１８２０１９年多因素检验报告不正确率㊁s i gm a 水平分布情况比较类型２０１８年不正确数量(n )不正确率(％)２０１９年不正确数量(n )不正确率(％)χ２P操作错误５６４９０．１２４７４５５００．０９６８３５．１８２＜０．００１流程错误４０７０．００９０３０４０．００６５４．０３３０．０４５结果不正确２６０．０００６５９０．００１３２．５７９０．１０８患者信息错误２２００．００４９１４５０．００３１４．０５０．０４４仪器故障１８０．０００４７２０．００１５６．３６８０．０１２标本质量错误４４０．００１０９５０．００２０３．３３３０．０６８试剂故障００．００００２２０．０００５５．００００．０２５合计６３６４０．１４０５５２４７０．１１１７１５２．３９０＜０．００１D P M１４０４．９１５１２８１１１６．７６１３s i gm a 水平４．４８４．５５同期检验报告总数４５２９８１１４６９８４０８㊀㊀注:为无数据.３㊀讨㊀㊀论检验报告不正确率可反映实验室检验报告正确性,涉及医疗安全及潜在风险,出现问题及错误较多的环节需提示工作人员关注,是实验室分析后的重要质量指标.数据可通过L I S 系统自动采集,但无法区分错误的类型,需进一步分析原因并提出有效的纠正措施.为减少检验报告不正确率,２０１４年以来中国医学科学院北京协和医院检验科持续在硬件和软件两个方面同时改进,及时解决电脑㊁键盘㊁鼠标等硬件老化问题.完善L I S 系统,针对结果为－ E R R O R ㊁多项或少项不能审核,弹出窗口或标记为待查等问题,与L I S 系统工程师对接,避免此类原因导致的取消审核报告问题.对检验科各专业组分别进行质量指标评估可以为提高检验质量提供更加可靠的数据支撑.且有利于各专业组根据自己的特点,及时发现除共性外的问题,有效提高质量.检验报告不正确率在微免组和分子组波动较大,可能与其标本量总数相对较少,相同的报告取消审核数量可能导致其检验报告不正确率较高有关.２０１８年科室质量管理分析显示部分员工检验报告不正确率大于同组其他人员,可能与错误编号等低级错误有关,故征求各组长意见,通过与专业组及个人绩效关联,各组２０１９年整体检验报告不正确率均明显降低,内分泌组略有上升,可能与专业组整合,加入了肿瘤标志物检测,标本量整体增加有关.检验报告不正确是由于各种原因造成的已发出的报告内容与实际情况不相符[４].本研究中主要归纳了７种错误,其中操作错误与检验人员素质㊁人员培训和规范检验结果解释性注释有很大关系[５Ｇ６].２０１８年与２０１９年操作错误㊁流程错误㊁患者信息错误发生率比较,差异有统计学意义(P ＜０．０５),说明改进措施有效.结果不正确一般不宜识别,一般是关注了二次质控或历史结果时,或临床㊁患者反馈后,才发现存在干扰或检测系统不足等导致的问题.目前,随着生化流水线逐渐普及,标本质量的观察至关重要,可使用血清指数(客观反映血清标本的乳糜㊁溶血和黄疸程度)提示报告审核者.但特殊情况下,因病情需要,临床仍希望继续对质量欠佳标本进行检测,检测后发现影响较大,只能作为不合格标本进行处理.以上是２０１９年结果不正确和标本质量错误发生率较２０１８年有所升高的主要原因,但差异无统计学意义(P ＞０．０５).２０１９年由于冷库故障,试剂保存条件不当,导致试剂故障较２０１８年上升.由于仪器老化㊁使用年限等问题不能解决,仪器故障频繁出现在２０１９年,较２０１８年明显增加,不能有效地通过年度维护进行改进.２０１８年与２０１９年的仪器故障和试剂故障发生率比较,差异有统计学意义(P ＜０．０５),科室应该采取其他的措施避免此类错误的发生.２０１９年整体的D P M 下降,s i gm a 水平较２０１８年升高,与文献报道的s i gm a 水平范围为４~５一致[６].说明改进措施有效,尤其是关键指标与个人绩效相关可有效促进操作错误㊁流程错误㊁患者信息错误等与人为主观相关因素的改善.为了有效地监控检验报告不正确率,L I S 系统不断升级,目前已实现报告取消审核权限设置㊁必须记录取消审核报告的原因㊁自动进行标识,整个审核过程均有记录,且H I S 端也会进行提示.检验报告不正确取消审核后,如果发生结果修改,尤其当医生已经根据错误报告进行了诊治,可能会造成医疗隐患[７].H I S 端的及时提醒,包含取消审核前后的结果及取消审核者和联系电话,若临床医生有疑问可及时与检验科沟通,保证患者安全.质量指标作为传统质控方法的补充,是评价质量㊁识别问题及监测检验过程的一(下转第１２８０页)３７２１国际检验医学杂志２０２１年５月第４２卷第１０期㊀I n t J L a bM e d ,M a y ２０２１,V o l ．４２,N o ．１０[７]Z HA N G Y,WA N G D,Y A N D,e t a l．M o l e c u l a r e v i d e n c e o f p e r s i s t e n te p i d e m i ca n de v o l u t i o no fs u b g e n o t y p eB１c o x s a c k i e v i r u sA１６Ｇa s s o c i a t e dh a n d,f o o t,a n d m o u t hd i sＧe a s e i nC h i n a[J]．JC l i n M i c r o b i o l,２０１０,４８(２):６１９Ｇ６２２．[８]WA N G X,S H E N C,C H E N T,e t a l．I m p r o v e d p l a s m i dＧb a s e d r e c o v e r y o fc o x s a c k i e v i r u s A１６i n f e c t i o u s c l o n e d r i v e nb y h u m a nR N A p o l y m e r a s eI p r o m o t e r[J]．V i r o lS i n,２０１６,３１(４):３３９Ｇ３４１．[９]A S WA T H Y R A JS,A R U N K UMA R G,A L I D J I N O U E K,e t a l．H a n d,f o o ta n d m o u t hd i s e a s e(H F M D):e m e rＧg i n g e p i d e m i o l o g y a n d t h e n e e d f o r a v a c c i n e s t r a t e g y[J]．M e d M i c r o b i o l I mm u n o l,２０１６,２０５(５):３９７Ｇ４０７．[１０]X I EJ,Y A N G X H,HUSQ,e t a l．C oＧc i r c u l a t i o no f c o xＧs a c k i e v i r u s e sAＧ６,AＧ１０,a n d AＧ１６c a u s e sh a n d,f o o t,a n d m o u t hd i s e a s e i n G u a n g z h o uc i t y,C h i n a[J]．B M CI n f e c tD i s,２０２０,２０(１):２７１．[１１]魏雷雷,王岙,吴东林,等．２０１５２０１７年吉林省柯萨奇病毒A组１６型基因特征分析[J]．中国生物制品学杂志,２０２０,３３(５):５３５Ｇ５３９．[１２]田晓灵,张勇,宋壮志,等．柯萨奇病毒A１６型的B１a和B１b两个分支在内蒙古自治区共同流行[J]．病毒学报,２０１３,２９(４):４２６Ｇ４３０．[１３]高红,顾文珍,倪红霞,等．宁波市手足口病优势毒株肠道病毒A组V P１编码区基因进化分析[J]．中国疫苗和免疫,２０１６,２１(３):２７８Ｇ２８２．[１４]张建群,罗学辉,李永东．浙江省余姚市手足口病病原谱和E V７１V P１基因分析[J]．中国卫生检验杂志,２０１６,２６(２１):３１６７Ｇ３１６９．[１５]邱晓枫,祝水芬,濮小英,等．杭州市肠道病毒７１型分离与V P１区域序列分析[J]．中国预防医学杂志,２０１１,１２(１２):１０１４Ｇ１０１８．[１６]刘佳,夏玛丽,郭秀华,等．我国部分省市手足口病E V７１V P１基因特征分析[J]．现代预防医学,２０１５,４２(１４):２６２６Ｇ２６２９．[１７]司鲁莹．肠道病毒７１型全基因组序列分析及V P１基因毒力位点研究[D]．济南:山东大学,２０１３．[１８]I N O U E K,S HO J IY,K U R A N EI,e ta l．A ni m p r o v e d m e t h o df o rr e c o v e r i n g r a b i e sv i r u sf r o m c l o n e dc D N A[J]．JV i r o lM e t h o d s,２００３,１０７(２):２２９Ｇ２３６．[１９]M A S A V U L I M G,W I J E S U N D A R A D K,U N D E R WO O D A,e t a l．Ah e p a t i t i sCv i r u sD N Av a c c i n e e n c o d i n g a s e c r eＧt e d,o l i g o m e r i z e d f o r mo f e n v e l o p e p r o t e i n s i sh i g h l y i m m uＧn o g e n i c a n de l i c i t sn e u t r a l i z i n g a n t i b o d i e s i nv a c c i n a t e d m i c [J]．F r o n t I m m u n o l,２０１９,１０:１１４５．[２０]魏国超,田文洪,王刚,等．C MV与T７启动子对仙台病毒微小基因组拯救效率的比较[J]．病毒学报,２０１２,２８(３):２３７Ｇ２４５．(收稿日期:２０２０Ｇ０８Ｇ２６㊀修回日期:２０２１Ｇ０１Ｇ０３)(上接第１２７３页)种有效工具,通过长期的横向和纵向比较,可帮助实验室监测质量水平.L I S系统使得实验室收集数据统计质量指标变得简单易行,为实验室质量改进提供了依据和可能,能够客观分析实验室质量风险来源,促进实验室信息化建设持续加强[８].通过对检验报告不正确率的监控可及时发现检验质量的偏离,确保检测工作的质量,尽量在实验室分析前或在检验结果审核中识别出标本错误,结合既往结果及时与临床沟通,避免存在干扰因素.如果在临床反馈结果不符时调查分析出的标本错误,应及时汇总,必要时保存相关临床联系/咨询/投诉三联表或不良事件/不合格工作二联表,请医务处和护理部等部门协助解决,在工作实践中不断探索,寻找有效的持续改进方法,提高质量.参考文献[１]中国合格评定国家认可委员会．医学实验室质量和能力认可准则:C N A SＧC L０２[S]．北京:中国合格评定国家认可委员会,２０１２．[２]中华人民共和国国家卫生和计划生育委员会．临床检验专业１５项医疗质量控制指标(２０１５版):国卫办医函[２０１５]２５２号[S]．北京:中国标准出版社,２０１５．[３]I n t e r n a t i o n a lF e d e r a t i o no fC l i n i c a lC h e m i s t r y a n dL a b oＧr a t o r y M e d i c i n e(I F C C)W o r k i n g G r o u p o n L a b o r a t o r y E r r o r s a n dP a t i e n t S a f e t y(WGＧL E P S)．I n t e r n a t i o n a l f e dＧe r a t i o n o f c l i n i c a l c h e m i s t r y a n d l a b o r a t o r y m e d i c i n ew o r k i n gg r o u p＂l a b o r a t o r y e r r o r sa n d p a t i e n tS a f e t y＂．MQ I s u p p o r tＧr e v i s i o n１[E B/O L]．(２０１７Ｇ０１Ｇ０１)[２０２０Ｇ０３Ｇ１６]．h t t p://w w w．i f c cＧm q i．c o m/M q i W e b/r e s o u r c e s/d o c/ Q u a l i t y I n d i c a t o r s_S u p p o r t_P r o c e s s e s．P d f．[４]郭翀,刘子杰,宋贵波,等．对１５项临床检验专业质控指标５年统计与分析[J]．中华检验医学杂志,２０１６,３９(１):２９Ｇ３３．[５]黄钰竹,王薇,赵海建,等．临床检验结果解释性注释的研究进展[J]．临床检验杂志,２０１８,３６(１２):９２０Ｇ９２２．[６]张鸿伟,李芜婷,吴菊芬,等．急诊检验不正确报告管理措施的探索[J]．实验与检验医学,２０１９,３７(４):６４９Ｇ６５１．[７]王治国,费阳,王薇,等．理解临床检验质量指标,抓质量从实验室内部做起[J]．中华检验医学杂志,２０１６,３９(１):４Ｇ６．[８]郭野,陈倩,吴卫,等．实验室信息管理系统在检验质量关键指标管理中的应用[J]．中华医学杂志,２０１５,９５(１２):８９８Ｇ９０２．(收稿日期:２０２０Ｇ０９Ｇ１６㊀修回日期:２０２０Ｇ１２Ｇ２９)０８２１国际检验医学杂志２０２１年５月第４２卷第１０期㊀I n t J L a bM e d,M a y２０２１,V o l．４２,N o．１０。

214342431_结合预训练和自训练的法律信息抽取增强式方法

第47卷第3期燕山大学学报Vol.47No.32023年5月Journal of Yanshan UniversityMay 2023㊀㊀文章编号:1007-791X (2023)03-0255-07结合预训练和自训练的法律信息抽取增强式方法㊀周裕林1,2,陈艳平1,2,黄瑞章1,2,秦永彬1,2,∗,林㊀川1,2(1.公共大数据国家重点实验室,贵州贵阳550025;2.贵州大学计算机科学与技术学院,贵州贵阳550025)㊀㊀收稿日期:2022-06-15㊀㊀㊀责任编辑:唐学庆㊀㊀基金项目:国家自然科学基金资助项目(62166007)㊀㊀作者简介:周裕林(1997-),男,贵州赤水人,硕士研究生,主要研究方向为自然语言处理;∗通信作者:秦永彬(1980-),男,山东招远人,博士,教授,博士生导师,主要研究方向为文本计算与认知智能㊁大数据治理与应用,Email:ybqin@㊂摘㊀要:在智慧法院的建设中,法律信息抽取是法律人工智能任务中最基本的任务㊂目前,法律信息抽取方法主要基于深度神经网络的监督学习模型㊂由于现有的监督学习模型需要大量的标签数据,而人工标注的方式会提高法律信息抽取任务的成本,存在只有少样本情况下模型学习性能较差的问题㊂针对上述问题,提出一种结合预训练和自训练的法律信息抽取增强式方法㊂首先,利用大规模预训练模型和标签数据训练出一个教师模型;然后,利用改进的文本相似度计算公式从法律文书库中寻找出与训练集相似的无标签法律文本数据,再结合训练完成的教师模型对其生成伪标签数据;最后,将有标签数据和伪标签数据混合起来重新训练出一个学生模型用于下游的法律信息抽取任务㊂本文在2021法研杯提供的信息抽取数据集上进行验证㊂与基线模型进行对比,本文提出的结合预训练和自训练的法律信息抽取增强式方法取得了较好的抽取效果㊂关键词:预训练;法律信息抽取;自训练;人工智能;自然语言处理中图分类号:TP391㊀㊀文献标识码:A㊀㊀DOI :10.3969/j.issn.1007-791X.2023.03.0090㊀引言随着智慧法院的建设,法律人工智能辅助任务受到日益的关注,其中法律信息抽取作为法律人工智能的第一步,直接用于支撑下游任务,如知识图谱构建㊁相似案例推荐㊁自动量刑建议等㊂法律信息抽取结果的不同,将会对下游任务产生不同的影响,直接影响下游任务的性能㊂深度学习作为法律人工智能任务中主流的方法,其训练法律人工智能任务模型往往需要标签数据,而法律文本数据人工标注成本较高㊂因此,在法律人工智能任务里,只有少量学习样本会导致模型学习性能较差㊂为了解决标注数据样本少和数据标注成本高的问题,在图像处理[1]领域最先有学者提出自训练(Self-training,ST)[2]的方法㊂自训练是一种半监督学习方法,它利用有标签数据训练出一个教师模型,让教师模型对无标签数据生成伪标签,来达到数据增强的效果㊂其中,伪标签是指利用自训练模型对无标签数据进行预测得到的非真实标签㊂由于法律文本的特殊性,选择不同案由的法律文本作为无标签数据进行自训练,所带来的差异性将会对法律信息抽取产生影响,使得模型对法律文本特征理解上产生差异,从而影响法律文本信息识别性能㊂尽管在如何选择无标签数据文本上提出了各种解决方案,如计算文本相似度㊁聚类等,但由于法律文本的特殊性,在选择无标签法律文本上仍存在不足㊂通过分析发现,主流的信息抽取技术存在少样本学习困难㊁数据增强技术中无标签数据选择不恰当的问题,使得模型在少样本法律文本信息抽取上性能较差㊂因而,面向信息抽取技术存在少样本学习困难㊁数据增强技术中无标签数据选择不恰当的特点,本文提出了结合预训练和自训练的法律信息抽取增强式模型,在2021法研杯提供的法律信息抽取数据集上进行验证㊂实验表明了本文提出方法的有效性㊂本文的主要贡献如下:1)本文结合预训练和自训练的方法,通过利256㊀燕山大学学报2023用无标签法律文本生成伪标签数据,增强了模型在少样本学习上的能力,实现法律信息的更好抽取㊂2)在充分分析法律文本特点的基础上,改进文本相似度函数以选择出更符合训练集的无标签法律文本数据,以提高模型特征学习能力㊂3)本文结合预训练和自训练方法首次应用于法律人工智能任务,为法律人工智能任务少样本学习提供了一种新思路㊂1㊀相关工作目前,信息抽取主流的方法是基于深度神经网络的有监督学习模型㊂然而,有监督学习模型需要大量的标签数据,而法律文本通过人工标注成本较高,存在法律人工智能标签数据较少的问题㊂Yao等[3]提出基于先验知识的图少样本学习㊂Zhang等[4]提出基于图卷积神经网络的清洁web 图片和原始训练图片的少样本学习方法㊂Bao 等[5]探索了对于少样本下文本分类的原学习的应用㊂Tseng等[6]利用Affine Transform去增强图片特征㊂Peng等[7]提出基于预训练-预训练-微调的方法应用于人物对话系统㊂随着大规模预训练模型BERT[8]的诞生,出现了许多BERT预训练模型的改进版,并且在小样本学习上也取得了不错的成绩㊂Liu等[9]通过对BERT进行优化,将原本静态遮蔽改为动态遮蔽,丢弃了下一句预测任务,使用了更大的批量和替换了文本的编码方式,提出了一个新的预训练模型RoBERT㊂Sun等[10]通过知识整合增强表示来优化BERT的遮蔽过程㊂Yang等[11]认为现有的BERT预训练模型会遭受微调阶段所带来的差异性,因此对原有的预训练模型进行修改,得到一个新的预训练模型XLNet㊂Lan等[12]提出一个改进的预训练模型ALBERT来解决内存消耗高和训练速度慢的问题㊂Clark等[13]通过采用类似于生成对抗式网络中的生成器与判别器,在微调阶段仅使用判别器的方法推出预训练模型ELECTRA㊂Cui等[14]利用以前的预训练模型,在遮蔽层进行修改,得到MacBERT㊂Cui等[15]在BERT基础上提出基于全词遮罩的BERT-wwm㊂Cui等[16]提出一种基于乱序的预训练模型PERT,将掩码标记去除的情况下学习文本语义信息㊂尽管大规模预训练模型在小样本上取得了不错得效果,但还存在以下不足:大规模预训练模型使用的是各个领域数据,在对法律人工智能任务中使用小样本进行微调时,由于学习样本较少,所获得的微调效果较差,导致下游任务性能不佳㊂因此,自训练方法被广泛应用于小样本任务上㊂Zoph等[17]在图像处理领域重新探讨了自训练和预训练的作用㊂Niu等[18]将自训练方法应用于机器阅读理解任务的软证据抽取,以解决成本昂贵问题㊂Xie等[19]通过使用自训练为学生模型加入噪声以提高图像分类的性能㊂Meng等[20]通过将远程监督和自训练方法结合起来用于命名实体识别任务以提高模型的泛化能力㊂2㊀法律信息抽取模型2.1㊀BERT预训练模型BERT预训练模型区别与传统的word2vec模型,它在Transformer[21]的基础上,用Transformer去捕获文本特征,并利用大量数据进行一个先学习,然后再代入到某个任务微调即可㊂随着硬件的不断发展,Transformer的层数从12层到24层,导致模型的参数越来越大,其学习特征的能力也越来越强,成就了现在的大规模预训练模型㊂研究证明,其文本提取特征能力远超于卷积神经网络和循环神经网络等模型㊂Transformer完全依赖于自注意力机制㊂自注意力从每个输入的词向量与训练后的矩阵W q㊁W k 和W v相乘所得Query㊁Key和Value向量,并将个矩阵向量分别合成矩阵,得到注意力公式如下: Z=Attention(Q,K,V)=softmaxQK Td k()V(1)式中:Q㊁K㊁V分别为Query㊁Key和Value组成的矩阵;d为Query向量的维度,在式中除以d k可以使得模型在训练过程中的梯度下降的更平稳㊂最后,利用softmax函数进行归一化得到每个单词的得分,使得编码器对不同得分的单词有不同的关注度㊂在Transformer的基础上,BERT预训练模型使用了遮蔽层语言模型,采用随机遮蔽一定比例的单词,通过预测被遮蔽的单词进行训练㊂并且第3期周裕林等㊀结合预训练和自训练的法律信息抽取增强式方法257㊀BERT 输入的Embedding 由三个Embedding 拼接而成,分别为TokenEmbedding㊁SegmentEmbedding 和Position Embedding,融合了字符信息㊁句子信息和位置信息,最终将拼接而成的Embedding 输入到BERT 编码器中获得输出隐藏层特征㊂由于预训练模型并不是本文的重点,所以在这不作过多阐述㊂2.2㊀自训练模型自训练模型的结构图如图1所示㊂本文将自训练模型分为4个步骤㊂首先,利用标签数据集结合预训练BERT 模型训练出一个教师模型,此教师模型用于后续的伪标签预测;接着,利用改进的文本相似度函数从法律文书库中寻找与训练集相似的无标签法律文书数据;然后,无标签数据集送入教师模型中生成伪标签,并从伪标签数据集中选择前K 个样本与标签数据集混合;最后,将混合的数据集重新训练得到一个学生模型用于下游任务㊂图1㊀结合预训练和自训练的法律信息抽取模型Fig.1㊀Legal information extraction model based on pre-training and self-training㊀㊀本文自训练的方法依赖于大规模无标签的法律文书库㊂由于法律文书包含许多案由,而不同案由之间内容差异较大,例如,民事案件和刑事案件在法律文书中书写及内容差异较大,利用不同的文本相似度搜寻与原本训练集中相似的法律文本存在困难㊂因此,如何从各种案由的法律文书库中搜寻到与训练集相似的法律文书成为本文研究的重点㊂本文考虑了欧氏距离和余弦距离来计算相似案由的文本:cos θ(x ,y )=ðni =1x i y i ðni =1x 2iðni =1y 2i,(2)d (x ,y )=ðni =1x i -y i ()2,(3)式中,x 和y 分别两个文本向量㊂使用不同的文本相似度函数计算会得到不同的结果㊂例如:欧氏距离更能体现个体数值特征间的绝对差异;余弦距离更多的是从方向上区分差异㊂由于法律案情错综复杂,使用普通的文本相似度函数在不同案由上有较大的差异性㊂而欧式距离和余弦距离因为其特点,分别在不同法律案由上存在着优势与劣势㊂因此,我们在结合欧氏距离和余弦距离的基础上,引入一个共现因子α:αw 1,w 2()=len w 1ɘw 2()len w 1()+len w 2(),(4)式中,w 1和w 2是两个文本分词结果列表㊂αɪ[0,1]表示为两个文本间的共现因子㊂通过对文本相似度函数引入共现因子能够更好地捕捉两个文本间的共现度,从而提高在搜寻最相似于训练集的无标签数据的能力,增强模型在自训练过程中数据特征的学习能力㊂最后,通过合并公式(2)~(4),获得一个改进的文本相似度函数:258㊀燕山大学学报2023 sim(x,y)=cosθ(x,y)d(x,y)+αcosθ(x,y)+d(x,y),(5)将法律文书库中无标签数据与训练集数据计算文本相似度取平均:S avg=1nðn i=0sim(x i,y)㊂(6)3㊀实验3.1㊀数据集实验所用数据均来自中国最高人民法院举办的第四届中国法研杯司法人工智能挑战赛(CAIL2021)㊂数据样本详细信息如表1所示㊂标签类别分为10类,包括犯罪嫌疑人(NHCS)㊁受害人(NHVI)㊁作案工具(NATS)㊁被盗物品(NASI)㊁被盗货币(NCSM)㊁物品价值(NCGV)㊁盗窃获利(NCSP)㊁时间(NT)㊁地点(NS)㊁组织机构(NO)㊂表1㊀数据集样本数量和标签数量统计信息Tab.1㊀Statistical information on the number of samplesand the number of labels in the data set类型训练集测试集NASI2587527NATS28983NCGV942205NCSM42178NCSP19437NHCS2961554NHVI1285279NO35170NS1582323NT12422553.2㊀评测指标实验指标均采用精准率P㊁召回率R和F1值㊂公式如下:P=N TPN TP+N FP,(7)R=N TPN TP+N FN,(8)F1=2PR P+R,(9)式中,N TP为把正类预测为正类的数量,N FP为把负类预测为正类的数量,N FN为把正类预测为负类的数量㊂3.3㊀参数设置模型超参数设置的不同对实验结果会产生较大的影响㊂超参数设置如表2所示㊂表2㊀超参数设置Tab.2㊀Hyperparameter settings参数名参数值初始学习率0.001Dropout0.5Batch_size128Epoch10优化器Adam3.4㊀实验结果及分析为验证结合预训练和自训练模型的法律信息抽取增强式方法的有效性,本文利用基线模型BERT与BERT+ST的方法作实验对比,如表3所示㊂从表3可以看出,在BERT预训练模型的基础上,结合自训练方法,可以有效地提高法律人工智能任务标签数据较少情况下的性能㊂具体为,训练集里标签数据最少的NATS和NCSP结合自训练方法后,F1值分别提高了2.2%和0.84%;总体上提高了0.33%㊂其原因在于:1)法律数据标签少的情况下,模型对标签数据特征识别不充分,导致对个别数量较少的标签识别性能较差㊂2)结合自训练方法后,通过半监督的方式来扩展标签数量,增强模型识别少样本标签数据的特征㊂由于自训练的方法为数据集中较少的标签类别,通过半监督的方式进行数据扩充,增强了模型学习标签类别特征的能力㊂通过实验分析发现,本文所提方法也加速了模型损失函数收敛的速度,如图2所示㊂原因在于:扩充的实体类别的同时增强了模型对实体类别数量较少的数据特征的学习能力,学习特征能力的增强导致模型损失函数收敛速度加快㊂在实验分析过程中发现,不同的预训练模型与自训练方法结合起来会有差异性㊂为验证不同预训练模型和自训练方法结合带来的差异性,本文选取了BERT㊁BERT-wwm㊁Roberta㊁Macbert㊁PERT预训练模型作实验对比,如表4所示㊂第3期周裕林等㊀结合预训练和自训练的法律信息抽取增强式方法259㊀表3㊀结合预训练和自训练模型与基线模型的实验结果Tab.3㊀Experimental results of combining pre-trainedand self-trained models with baseline models模型标签P /%R /%F 1/%BERT NASI81.8688.8985.23NATS 80.0081.6980.84NCGV 98.5297.3297.91NCSM 90.3292.1191.21NCSP80.4694.5986.96NHCS 93.5398.6096.00NHVI 92.1490.3291.22NO 86.9990.7188.81NS 81.0887.9984.39NT 90.3197.0593.56总体88.1892.8590.45BERT +STNASI 81.2489.785.26NATS 81.6384.5183.04NCGV 98.2796.8397.54NCSM 88.1292.7690.38NCSP80.0097.3087.80NHCS 94.5398.5196.48NHVI 91.6891.5091.59NO 85.3391.4388.28NS 81.3488.1584.61NT 92.8797.2595.01总体88.3993.3090.78图2㊀损失函数迭代收敛变化图Fig.2㊀Loss iteration convergence diagram㊀㊀从表4可以看出,结合自训练方法后,不同的预训练模型在法律信息抽取任务上F 1值都获得了提高㊂BERT㊁BERT-wwm㊁PERT㊁Roberta 和Macbert 分别提高了0.33%㊁0.48%㊁1.16%㊁0.9%和0.3%㊂在BERT-wwm 上获得最高性能,原因在于通过利用全词遮蔽(Whole Word Masking,wwm)来进一步提高了BERT 的性能;在PERT 上获得最高提升㊂其中,Roberta 和Macbert 等均为近年来超大规模预训练模型,在结合了自训练方法后都得到不同程度的提升,由此验证了本文方法的有效性㊂表4㊀不同预训练模型实验对比Tab.4㊀Experimental comparison of different pre-trained models模型P /%R /%F 1/%BERT88.1892.8590.45BERT +ST 88.3993.3090.78BERT-wwm88.8592.9890.86BERT-wwm +ST 89.8192.9391.34PERT87.0490.7588.86PERT +ST 88.0292.1190.02Roberta 88.2192.4690.28Roberta +ST 89.0993.3791.18Macbert 87.7592.5990.10Macbert +ST 87.7493.2490.40㊀㊀由于本文的方法旨在解决法律人工智能任务中小样本问题,本文将训练集按10%㊁20%㊁40%和80%的比例划分,观察在训练集样本少的情况下,结合预训练模型和自训练方法在法律信息抽取上的变化过程,测试集保持不变㊂根据表4中不同预训练模型带来的差异性,选取性能最高的BERT-wwm 作为基线模型进行对比,如表5所示㊂表5㊀结合预训练和自训练在不同比例训练集下的性能变化Tab.5㊀Performance variation for combining pre-training andself-training with different scaled training sets比例模型P /%R /%F 1/%10%BERT-wwm68.2340.5750.88BERT-wwm +ST 72.8075.9074.3220%BERT-wwm 71.4971.8671.67BERT-wwm +ST 75.4572.6674.0340%BERT-wwm 85.8687.1486.50BERT-wwm +ST 85.9289.3087.5880%BERT-wwm 86.4892.4889.38BERT-wwm +ST 86.9694.4590.55㊀㊀从表5可以看出,在训练集样本特别少的情况下,结合自训练的方法后,其性能获得了较大的提升,在训练集样本数只有10%的情况下结合自训练的方法F 1值提升了23.44%㊂但随着数据集260㊀燕山大学学报2023的增大,自训练的方法提升效果逐渐减缓㊂在训练集20%㊁40%和80%的情况下结合自训练方法F1值分别提高了2.36%㊁1.08%和1.17%㊂其原因在于:1)数据样本特别少的情况下,通过BERT预训练模型进行微调,模型不能充分学习数据特征㊂结合自训练方法后,尽管在生成伪标签同时增加了噪声,但更多的数据能增强模型特征的学习,并且噪声也能提高模型的鲁棒性[18]㊂2)BERT 已经是通过海量的数据所预训练出的模型,其语言表征学习已经很强大㊂在数据样本较为充足的情况下,只需通过微调即可获得优异的性能,其性能并不会随着数据量的递增而递增㊂以上实验结果证明,在小样本情况下,结合预训练和自训练的方法会获得较大的提升㊂为验证在结合自训练方法时,需要从法律文书库中挑选出合适的无标签数据而改进的文本相似度函数的有效性㊂本文将改进的文本相似度函数与随机选择㊁余弦相似度函数等作对比实验,验证本文提出改进的文本相似度函数的有效性㊂如表6所示㊂所选用预训练模型均为BERT-wwm㊂表6㊀无标签数据选择函数实验对比Tab.6㊀Experimental comparison of unlabelleddata selection functions方法P/%R/%F1/%随机选择89.2892.8391.02余弦相似度89.7292.8191.24本文方法89.8192.9391.34㊀㊀从表6可以看出,本文改进的文本相似度函数相比于随机选择来说提高了0.32%,比余弦距离提高了0.1%㊂其原因在于:1)案由的种类众多,选择不同案由的法律文书对法律信息抽取会产生一定影响㊂2)本文方法在普通文本相似度计算函数的基础上加入共现因子,能够更好地寻找出与训练集相似的法律文书进行自训练,同时也能减少噪声㊂最后,为验证本文提出方法的通用性,本文在公共数据集MSRA上进行实验验证,如表7所示,实体标签有地名(LOC)㊁组织机构(ORG)㊁人名(PER)㊂在基线模型的基础上,本文提出的方法在MSRA数据集上F1值提高了0.24%,由此验证了本文方法的有效性㊂表7㊀通用性实验验证结果Tab.7㊀The results of universal experiment were verified模型标签P/%R/%F1/% BERT-wwmLOC96.5293.4494.95ORG87.9691.8089.84PER95.6595.4495.55总体94.1493.5193.83 BERT-wwm+STLOC95.8594.1895.01ORG88.9589.4389.19PER96.8097.0196.91总体94.4193.7394.07 4㊀结论本文的工作主要有:1)针对法律信息抽取任务中人工标注成本昂贵问题,结合预训练和自训练的方法可以增强模型在小样本数据集下的识别性能㊂2)改进文本相似度函数,提高从法律文书库中搜寻与训练集相似的法律文书,从而增强自训练学习的能力㊂实验结果表明,本文结合预训练和自训练的法律信息抽取增强式方法能够提高模型在小样本数据集上的学习㊂参考文献1王丹李琦梁栋等.基于多尺度全卷积与CRF的路面裂缝检测算法 J .燕山大学学报2021 45 4 367-376. WANG D LI Q LIANG D et al.Road crack detection algorithms based on multi-scale fully convolution and CRF J . Journal of Yanshan University 2021 45 4 367-376.2SCUDDER H.Probability of error of some adaptive pattern-recognition machines J .IEEE Transactions on Information Theory 1965 11 3 363-371.3YAO H ZHANG C WEI Y et al.Graph few-shot learning via knowledge transfer C//Proceedings of the AAAI Conference on Artificial Intelligence Palo Alto USA 2020 6656-6663.4ZHANG J ZHANG M LU Z et al.AdarGCN adaptive aggregation GCN for few-shot learning C//Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision Waikoloa USA 2021 3482-3491.5BAO Y WU M CHANG S et al.Few-shot text classification with distributional signatures C//International Conference on Learning Representations Addis Ababa Ethiopia 2020.6TSENG H Y LEE H Y HUANG J B et al.Cross-domain few-shot classification via learned feature-wise transformation C// International Conference on Learning Representations Addis Ababa Ethiopia 2020.第3期周裕林等㊀结合预训练和自训练的法律信息抽取增强式方法261㊀7PENG B ZHU C LI C et al.Few-shot natural language generation for task-oriented dialog C//Findings of the Association for Computational Linguistics EMNLP2020 Stroudsburg USA 2020 172-182.8DEVLIN J CHANG M W LEE K et al.BERT Pre-training of deep bidirectional transformers for language understanding C// Proceedings of the2019Conference of the North American Chapter of the Association for Computational Linguistics Human Language Technologies Stroudsburg USA 2019 4171-4186.9LIU Y OTT M GOYAL N et al.Roberta a robustly optimized BERT pretraining approach EB/OL .2019-07-26 2022-06-15 . https ///abs/1907.11692.10SUN Y WANG S LI Y et al.Ernie Enhanced representation through knowledge integration EB/OL .2019-04-19 2022-06-15 .https ///abs/1904.09223.11YANG Z DAI Z YANG Y et al.XLNet generalized autoregressive pretraining for language understanding C// Proceedings of the33rd International Conference on Neural Information Processing Systems Red Hook USA 2019 5753-5763.12LAN Z CHEN M GOODMAN S et al.ALBERT A lite BERT for self-supervised learning of language representations C// International Conference on Learning Representations Addis Ababa Ethiopia 2020.13CLARK K LUONG M T LE Q V et al.ELECTRA Pre-training text encoders as discriminators rather than generators C//International Conference on Learning Representations New Orleans USA 2019 1-18.14CUI Y CHE W LIU T et al.Revisiting pre-trained models forChinese natural language processing C//Findings of the Association for Computational Linguistics EMNLP2020 Stroudsburg USA 2020 657-668.15CUI Y CHE W LIU T et al.Pre-training with whole word masking for Chinese BERT J .IEEE/ACM Transactions on Audio Speech and Language Processing 2021 29 3504-3514.16CUI Y YANG Z LIU T.PERT Pre-training BERT with permuted language model EB/OL .2022-03-14 2022-06-15 . https ///abs/2203.06906.17ZOPH B GHIASI G LIN T Y et al.Rethinking pre-training and self-training J .Advances in Neu-ral Information Processing Systems 2020 33 3833-3845.18NIU Y JIAO F ZHOU M et al.A self-training method for machine reading comprehension with soft evidence extraction C//Proceedings of the58th Annual Meeting of the Association for Computational Linguistics Seattle USA 2020 3916-3927. 19XIE Q LUONG M T HOVY E et al.Self-training with noisy student improves imagenet classification C//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Seattle USA 2020 10687-10698.20MENG Y ZHANG Y HUANG J et al.Distantly-supervised named entity recognition with noise-robust learning and language model augmented self-training C//Proceedings of the2021 Conference on Empirical Methods in Natural Language Processing Bangkok Thailand 2021 10367-10378.21VASWANI A SHAZEER N PARMAR N et al.Attention is all you need J .Advances in Neural Information Processing Systems 2017 30 6000-6010.An enhanced method of legal information extractionbased on pre-training and self-trainingZHOU Yulin1 2CHEN Yanping1 2HUANG Ruizhang1 2QIN Yongbin1 2LIN Chuan1 21.State Key Laboratory of Public Big Data Guiyang Guizhou550025 China2.College of Computer Science&Technology Guizhou University Guiyang Guizhou550025 ChinaAbstract In the construction of"Intelligent Courts" legal information extraction is the most fundamental task in legal artificial intelligence.At present legal information extraction methods are mainly based on supervised learning models of deep neural networks.The existing supervised learning models require a large amount of labeled data manual annotation methods can lead to high costs for legal information extraction tasks and poor learning performance becomes a problem when only a few-shot is available.To address these problems an augmented approach to legal information extraction that combines pre-training and self-training is proposed.First a teacher model is trained using a large-scale pre-training model and labeled data.Then an improved text similarity formula is used to find unlabeled legal text data from a bank of legal documents that are similar to the training set which is then combined with the trained teacher model to generate pseudo-labeled data.Finally the labeled data and pseudo-labeled data are mixed together to retrain a student model for the downstream legal information extraction task.The proposed method is validated on the information extraction dataset provided by the2021CAIL and the experimental results show that this method achieves better result compared to baseline model.Keywords pre-training legal information extraction self-training artificial intelligence natural language processing。

《环境分析化学》PPT课件

—— 宽度100-1000米:设水面0.3-0.5米下一个采样点水深10-50米，设三个采样点（上中下）
3）采样时间和采样频率的确定
河流:丰水期、平水期、枯水期，每期采样二次
排污渠:每年3次 4．地下水质监测方案的制定 5．水污染源监测方案的制定
工业废水：车间排污口监测一类污染物，总排污口监测二类污染物或在处理设施的排放口
0.04
0.10
0.15
PM10
日平均
0.05
0.15
0.25
氮氧化物 NOx
年平均日平均 1小时平均
0.05 0.10 0.15
0.05 0.10 0.15
0.10 0.15 0.30
二氧化氮 NO2
年平均日平均 1小时平均
0.04 0.08 0.12
0.04 0.08 0.12
0.08 0.12 0.24
高时斑齿病来源:铝加工、玻璃、磷肥、电镀、陶瓷、农药等含氮化合物：氨氮、亚硝酸盐氮、硝酸盐氮、有机氮、总氮硫化物——来源：焦化、造气、选矿、造纸、印染、制革毒性：危害细胞色素、氧化酶—使细胞缺氧，并腐烂管道
11、有机化合物的测定
化学需氧量在一定条件下，氧化1升水样中还原性物质所消
耗的氧化剂的量，用O2 mg/L 高锰酸盐指数生化需氧量（BOD5）：单位体积水中有机物生物降解所消耗的溶
Ⅰ、Ⅱ类水从严控制排污，Ⅲ类水执行一级污水排放标准， Ⅳ、Ⅴ类水执行二级污水排放标准，城镇下水道（进入二级水处理厂）执行三级污水排放标准。第一类污染物：
在环境或生物体内积蓄，对人体产生长远不良影响 Hg Cd Cr As Pb Ni 苯并芘 (P13表1-4标准) 第二类污染物：执行一级、二级、三级标准

聚乙烯亚胺-金属络合物的稳定常数及配位数的测定

Vol.33高等学校化学学报No.122012年12月 CHEMICAL JOURNAL OF CHINESE UNIVERSITIES 2633~2637聚乙烯亚胺鄄金属络合物的稳定常数及配位数的测定黄佳华1,2,弓振斌1,3,林继军2,段华玲2(1.厦门大学近海海洋环境科学国家重点实验室,2.海洋与地球学院,3.环境与生态学院,厦门361005)摘要　将聚合物络合超滤(PC⁃UF)技术与电感耦合等离子体质谱(ICP⁃MS)结合,利用化学理论计算模型,建立了测定聚乙烯亚胺(PEI)与金属离子络合稳定常数及平均配位数的方法.将该方法用于PEI 与Cd 2+的络合过程.配制不同浓度比的PEI 和Cd 2+的混合溶液,待络合反应平衡后,用超滤离心管离心分离高分子PEI⁃Cd 络合物,自由离子Cd 2+及其小分子络合物渗滤至滤液中;用10mL 体积分数为3%稀硝酸将滤膜上截留的PEI⁃Cd 络合物解离,离心得到Cd 2+的稀硝酸溶液;用ICP⁃MS 分别测定2次超滤后滤液中Cd 2+的浓度,利用化学理论模型进行计算,得到PEI⁃Cd 络合物的稳定常数和平均配位数.pH =4.0~5.9时,PEI⁃Cd 络合平衡的研究结果表明,稳定常数和平均配位数均随pH 值的增大而增大,较低程度的质子化可使PEI 与Cd 2+的络合能力增强,络合稳定常数增大.关键词　聚乙烯亚胺;络合稳定常数;配位数;超滤技术;电感耦合等离子体质谱中图分类号　O657.63;O614.24 文献标识码　A doi :10.7503/cjcu20120405收稿日期:2012⁃04⁃26.基金项目:厦门大学近海海洋环境科学国家重点实验室自主创新项目(批准号:MELRI0703)资助.联系人简介:弓振斌,男,博士,教授,主要从事分析化学和环境化学研究.E⁃mail:zbgong@ 聚合物络合超滤(PC⁃UF)技术利用聚合物与金属离子络合形成尺寸较大的高分子络合物,超滤时无法通过滤膜而被截留,而未络合的离子由于其空间体积小于滤膜孔径而渗滤至滤液中,从而实现分离的目的.该技术在去除或回收工业废水中的金属离子方面已被广泛应用[1~4].聚乙烯亚胺(PEI)因其良好的水溶性㊁化学稳定性以及其分子链上大量的胺基,成为使用PC⁃UF 技术进行过渡金属的分离[5]㊁金属元素回收[6]以及海水中痕量金属元素与基体的分离[7]等研究中常用的聚合物.聚合物与金属离子形成络合物的稳定常数及配位数等基础数据是聚合物分离㊁富集或回收金属元素等过程最佳条件选择的基础[1,8,9],有助于从理论上探讨PC⁃UF 技术的应用前景.但迄今关于溶液中PEI 与金属元素形成络合物(PEI⁃M 络合物)的稳定常数及平均配位数等数据的研究报道较少,Juang 等[10]对络合反应机理进行了研究;也有关于个别元素形成络合物的稳定常数的报道[10~13].水溶液中聚合物与金属络合反应稳定常数的测定方法主要有电位滴定法[11,12,14,15]㊁分光光度法[16]以及超滤分离法[10,13].电位滴定法测定PEI⁃M 络合物的稳定常数和配位数的方法是向已知浓度的PEI 和金属混合溶液中滴加标准的碱溶液,记录碱溶液滴定的体积和溶液的pH 值,结合生成函数(Bjerrum 函数)计算得到数据[11,12],该方法测定过程和计算比较繁琐.利用超滤将聚合物㊁金属络合物与其它金属相分离,根据计算公式求得稳定常数的方法称为超滤分离法,应用该方法测定PEI⁃M 络合物的稳定常数和配位数的研究尚存在未考虑OH -的影响[13]和直接设定配位数的值来求得稳定常数[10,13]等不足.Juang 等[10]采用超滤分离法结合计算模型测定了不同浓度比的PEI 和Cu 2+条件下PEI⁃Cu 络合物的稳定常数和平均配位数,其结果存在较大差别.因此,有必要发展更简单㊁准确且可靠的测定方法.本文通过建立化学理论计算模型,利用PC⁃UF 技术和电感耦合等离子体质谱(ICP⁃MS),提出了一种测定PEI⁃M 络合物稳定常数和平均配位数的方法.并将其用于测定PEI⁃Cd 2+络合物的稳定常数和平均配位数.该方法简单㊁准确,适用于测定PEI 与不同金属离子形成的络合物.4362高等学校化学学报 Vol.33　1　实验部分1.1　试剂与仪器质量分数为50%的聚乙烯亚胺(平均分子量M w=750000,美国Sigma⁃Aldrich公司)的水溶液; 1000mg/L Cd2+标准储备溶液(国家标准物质中心);硝酸㊁醋酸和醋酸钠(优级纯,德国Merck公司); HAc⁃NaAc缓冲溶液浓度为0.02mol/L.实验用水为Milli⁃Q超纯水(18.2MΩ㊃cm).15mL超滤离心管(美国Millipore公司),其核苷酸截留分子量(MWCO)为10000;5810R型台式高速离心机(德国Eppendorf公司);THZ⁃82型恒温振荡水浴箱(金坛市富华仪器有限公司).7700x型ICP⁃MS(美国Agilent Technologies公司),工作参数:射频功率1500W,采样深度8.0mm,冷却气流速15.0L/min,辅助气流速1.0L/min,载气流速0.8L/min,补偿气流速0.3L/min;AR35⁃FM04EX微流雾化器(澳大利亚Glass Expansion公司),恒温2℃,样品提升量0.5mL/min;测定结果为3次重复测定取平均值,标准校正曲线进行定量.1.2　实验过程将15mL超滤离心管在体积分数为2%硝酸中浸泡24h后,用水淋洗3次,再用水浸泡24h后,置于洁净操作台内风干㊁备用.实验中使用的低密度聚乙烯瓶(LDPE)㊁聚四氟乙烯瓶(PTFE)及其它器皿均按照文献[17]中的洗涤步骤洗涤后备用.移取100mL一定pH值的0.02mol/L HAc⁃NaAc缓冲溶液于LDPE瓶中,加入适量PEI溶液和Cd2+标准溶液,置于25℃恒温水浴箱中振荡反应30min后,移取10mL混合溶液至15mL超滤离心管,离心15min(6000r/min),用3mL同一pH值缓冲液淋洗超滤离心管内壁后㊁离心,合并2次滤液并转移至容量瓶中定容;更换滤液收集管后,再用10mL3%硝酸分2次淋洗超滤离心管内壁㊁离心,以将Cd2+从PEI⁃Cd络合物中完全解离并转移至稀硝酸溶液中,合并2次滤液并转移至容量瓶中定容.使用ICP⁃MS分别测定2次收集于容量瓶中的镉浓度.改变溶液的pH值,以研究溶液酸度变化对PEI 与Cd络合反应平衡的影响.2　结果与讨论2.1　溶液中的络合反应化学理论模型的建立二价金属离子(M2+),如Cd2+,Cu2+,Co2+,Ni2+和Pb2+等,可与PEI分子中的胺基发生络合作用[10,11].若溶液中仅含Cd2+,当加入PEI后,溶液中发生的反应主要有PEI与Cd2+的络合㊁PEI的质子化以及金属氢氧络合物的形成[10];为了控制溶液pH值,实验采用HAc⁃NaAc缓冲溶液,故还存在Cd2+与Ac-的络合反应.在上述反应中,PEI与Cd2+的络合反应[Cd2++n⥫⥬PEI Cd(PEI)n]为主反应,反应常数即为形成PEI⁃Cd络合物的稳定常数(K PEI⁃Cd):K PEI⁃Cd=[Cd(PEI)n]/[Cd2+]㊃[PEI]n(1)式中,[Cd2+]和[Cd(PEI)n]分别为络合反应平衡时,溶液中以自由离子和PEI⁃Cd络合物形式存在的镉的浓度;[PEI]为络合反应平衡时,未形成PEI⁃Cd络合物且未被质子化的中性胺基的浓度;n为溶液中Cd2+与PEI分子中配位的胺基个数,即PEI⁃Cd络合物的配位数.溶液中存在副反应,如PEI质子化㊁Cd2+与OH-或Ac-的络合反应,反应方程分别为PEI+H⥫⥬+PEI⁃HCd2++i OH⥫⥬-Cd(OH)iCd2++j Ac⥫⥬-Cd(Ac)j上述反应方程式中,PEI⁃H表示PEI分子中的1个胺基与H+的质子化反应,其浓度[PEI⁃H]是PEI分子中质子化胺基的浓度.各副反应的反应常数分别为K PEI⁃H=[PEI⁃H][PEI][H+](2)K Cd⁃OH =[Cd(OH)i ][Cd 2+][OH -]i (3)K Cd⁃Ac =[Cd(Ac)j ][Cd 2+][Ac -]j (4)变换式(1)~(4)可得:lg [Cd (PEI)n ][Cd 2+]+[Cd(OH)i ]+[Cd(Ac)j ]=n lg[PEI]+lg K PEI⁃Cd -lg(K Cd⁃OH [OH -]i +K Cd⁃Ac [Ac -]j +1)(5)设y =[Cd (PEI)n ][Cd 2+]+[Cd(OH)i ]+[Cd(Ac)j ],则上式简化为lg y =n lg[PEI]+lg K PEI⁃Cd -lg(K Cd⁃OH [OH -]i +K Cd⁃Ac [Ac -]j +1)(6)式(5)中,[Cd 2+]+[Cd(OH)i ]+[Cd(Ac)j ]表示主㊁副反应达到平衡时,未形成PEI⁃Cd 络合物的镉的浓度,即Cd 2+,Cd(OH)i 和Cd(Ac)j 3种形态浓度之和,亦即实验中第一次超滤时滤液中镉的总浓度.式(5)中左边各项可通过2次超滤后所得滤液以及ICP⁃MS 测定求得;K Cd⁃OH 和K Cd⁃Ac 为常数[12,18,19];[PEI]为溶液中未被质子化的中性胺基的浓度,是与pH 值相关的变量,可通过文献[19]查找K PEI⁃H 进行计算.以式(5)中左边比值的对数为纵坐标,以lg[PEI]为横坐标进行线性拟合,则待测PEI⁃Cd 络合物的稳定常数(K PEI⁃Cd )可由拟合直线的截距求得,斜率为PEI⁃Cd 络合物的平均配位数n .实验涉及的超滤膜分离过程基于以下假设:(1)Cd 2+,小分子Cd⁃OH 和Cd⁃Ac 络合物与超滤膜之间无相互作用,即它们在超滤过程中不会被滤膜截留,全部进入滤液中[1,13],并且实验中控制溶液pH<6,几乎不形成Cd⁃OH 络合物;(2)超滤膜对PEI 分子和PEI⁃Cd 络合物的截留效率均约为100%,即它们在超滤过程中完全被滤膜截留.实验中使用的PEI 的平均分子量(M w =750000)与超滤膜对核苷酸截留分子量(MWCO =10000)之比为75∶1,远大于理论上超滤过程对膜选择的要求[3,20];而PEI⁃Cd 络合物与PEI 分子量相近,理论上能被完全截留.利用上述理论模型设计如下实验:使用超滤离心管对形成络合物的金属离子与溶液中以自由离子形态(Cd 2+)或小分子络合物[Cd(OH)i ,Cd(Ac)j ]存在的金属进行分离.形成的PEI⁃Cd 络合物用稀硝酸解离后,络合物中的金属重新转化为自由离子形态.通过测定2次滤液中镉的浓度,得到[Cd(PEI)n ]和[Cd 2+]+[Cd(OH)i ]+[Cd(Ac)j ]的比值.上述步骤简便㊁快速,不仅可使各种形态金属元素按需分离,也方便使用ICP⁃MS 进行准确测定.2.2　pH 值对PEI⁃Cd 络合反应平衡的影响Fig.1　Effect of pH value on complexation equilibrium Initial concentration of Cd 2+:50μg /L;total ion strength:0.20mol /L.pH 值对PEI 和Cd 2+络合反应平衡的影响通过PEI 分子中胺基的质子化反应来实现[3,21,22].为保证PEI 与Cd 2+的络合反应在固定的pH 值条件下进行,实验选用HAc⁃NaAc 缓冲体系(离子强度I =0.20mol /L),分别将溶液的pH 值控制为4.0,5.0,5.5和5.9,考察溶液pH 值对PEI⁃Cd 络合反应平衡的影响.由图1可见,pH 值对Cd 2+与PEI 络合反应平衡的影响显著.pH 值无论为4.0,或为5.0,5.5和5.9时,尽管大部分PEI 以质子化形式存在,但随PEI 加入量增加,中性胺基的量也增大,以Cd 2+,Cd(OH)i 和Cd(Ac)j 等简单离子形态存在的金属元素的浓度逐渐减少,而更多以PEI⁃Cd 络合物形态存在.不同pH 值时,lg y 与lg[PEI]均呈良好的线性关系,说明式(5)的化学理论模型是正确的.研究结果表明,pH 值对PEI 的质子化影响明显,pH =3.0时只有0.00001%的胺基未发生质子化,pH 为5.0时只有0.001%未质子化,pH 为7.0时仍有99.91%质子化[12].实验条件下(pH =4.0~5.9),PEI 质子化程度相当严重,PEI 的质子化在5362　No.12　黄佳华等:聚乙烯亚胺⁃金属络合物的稳定常数及配位数的测定客观上使PEI 参与副反应而阻碍了PEI 分子中中性胺基与Cd 2+的络合.由于PEI 分子中的胺基对各种金属离子的络合能力存在差异,通过调节溶液pH 值达到分离各种金属离子的目的.2.3　PEI⁃Cd 络合物稳定常数的测定依照2.1节中的化学理论模型及超滤和ICP⁃MS 测定方法,实验中采用下述2种方法测定PEI⁃Cd 络合物稳定常数:(1)在50μg /L Cd 2+溶液中加入不同浓度的PEI,得到一系列不同Cd 2+/PEI 浓度比的混合溶液,按照实验步骤进行络合反应,测定络合反应平衡时溶液中的[Cd (PEI)n ]和[Cd 2+]+[Cd(OH)i ]+[Cd(Ac)j ],依照式(5)处理数据并进行线性拟合,求得PEI⁃Cd 络合物的稳定常数和平均配位数;(2)在90mg /L PEI 溶液中加入不同量的Cd 2+,得到一系列不同Cd 2+/PEI 浓度比的混合溶液,按照实验步骤操作,测定络合反应平衡时溶液中[Cd(PEI)n ]和[Cd 2+]+[Cd(OH)i ]+[Cd(Ac)j ]的比值,利用方法(1)得到的平均配位数和式(5)计算得到PEI⁃Cd 络合物的稳定常数.在25℃,pH =4.0时,依照上述2种方法测定的PEI⁃Cd 络合物的稳定常数见表1.结果表明,上述2种方法测得的PEI⁃Cd 络合物的稳定常数一致,可采用其中任一种方法测定稳定常数.Table 1　Complexation stability constant of PEI⁃Cd complex at pH =4.0(25℃,I =0.20mol /L )Initial concentration Concentration at equilibrium(measured or calculated)Reference data Calculated value [Cd 2+]/(μg㊃L -1)[PEI]/(mg㊃L -1)108[PEI]/(mol amine㊃L -1)y1010[OH -]/(mol㊃L -1)[Ac -]/(mol㊃L -1)K Cd⁃OH [OH -]i K Cd⁃Ac [Ac -]j K PEI⁃H [H +]n lg K PEI⁃Cd 5025 1.880.1810.030 1.47104.490.997.085070 5.270.3610.030 1.47104.490.997.085014010.500.7910.030 1.47104.490.997.085022016.60 1.2010.030 1.47104.490.997.085033024.80 2.1710.030 1.47104.490.997.082090 6.770.4510.030 1.47104.490.99 6.994090 6.770.4610.030 1.47104.490.997.016090 6.770.3910.030 1.47104.490.99 6.938090 6.770.4010.030 1.47104.490.99 6.94 表2列出了25℃下,pH 为4.0~5.9时PEI⁃Cd 络合物的稳定常数以及文献[11~13]报道的结果.可见,在此pH 范围内,PEI⁃Cd 络合物的稳定常数随着pH 值的增大而增大,平均配位数也随着pH 值的增大而变大,即随着溶液酸度变化,配位数可能是1或者2甚至更大,这与文献[10,11,14]结果一致;尽管PEI 平均分子量㊁测定方法和所利用的理论模型等与文献[11~13]存在差异,实验测得的稳定常数与文献值相当接近,而且测定精度较高,标准偏差为0.09~0.11,说明实验建立的化学理论模型和测定方法是合理㊁可靠的.Table 2　Comparison of PEI⁃Cd complexation stability constants and coordinating numbersCondition lg K PEI⁃Cd n Reference Method pH =4.0,25℃,I =0.20mol /L 7.08±0.100.99This study Ultra⁃filtration pH =5.0,25℃,I =0.20mol /L7.95±0.06 1.14This study Ultra⁃filtration pH =5.5,25℃,I =0.20mol /L 8.62±0.11 1.33This study Ultra⁃filtration pH =5.9,25℃,I =0.20mol /L 8.96±0.09 1.41This study Ultra⁃filtration 1.0mol /L NaNO 3,25℃8.57[11]Potentiometric titration 1.0mol /L KCl,25℃11.0[12]Potentiometric titration pH =6.0 6.062[13]Ultrafiltration 综上所述,利用所建立的化学理论模型,结合PC⁃UF 技术与ICP⁃MS 方法,测定了PEI⁃Cd 络合物在pH =4.0~5.9时的稳定常数和平均配位数.结果表明,在此pH 值范围内,PEI⁃Cd 络合物的稳定常数随pH 值的增大而增大,这与PEI 分子中的胺基在不同pH 值时的质子化程度有关.本文方法简单㊁快速㊁可靠,还可应用于除镉以外其它金属元素与PEI 形成的络合物稳定常数㊁平均配位数的测定.参　考　文　献[1]　Juang R.S.,Liang J.F..J.Membr.Sci.[J],1993,82(1/2):163 174[2]　Strathmann H..Separ.Sci.Tech.[J],1980,15(4):1135 11526362高等学校化学学报 Vol.33　[3]　Volchek K.,Krentsel E.,Zhilin Y.,Shtereva G.,Dytnersky Y..J.Membr.Sci.[J],1993,79(2/3):253 272[4]　Rumeau M.,Persin F.,Sciers V.,Persin M.,Sarrazin J..J.Membr.Sci.[J],1992,73(2/3):313 322[5]　Juang R.S.,Chiou C.H..J.Membr.Sci.[J],2000,177(1/2):207 214[6]　Canizares P.,Perez A.,Camarillo R..Desalination[J],2002,144(1 3):279 285[7]　LIN Ji⁃Jun(林继军),DUAN Hua⁃Ling(段华玲),GONG Zhen⁃Bin(弓振斌).Chin.J.Anal.Chem.(分析化学)[J],2011,39(6):906 910[8]　Morlay C.,Cromer M.,Mouginot Y.,Vittori O..Talanta[J],1998,45(6):1177 1188[9]　Morlay C.,Cromer M.,Mouginot Y.,Vittori O..Talanta[J],1999,48(5):1159 1166[10]　Juang R.S.,Chen M.N..Industrial and Engineering Chemistry Reseach[J],1996,35(6):1935 1943[11]　Jarvis N.V.,Wagener J.M..Talanta[J],1995,42(2):219 226[12]　Kobayashi S.,Hiroishi K.,Tokunoh M.,Saegusa T..Macromolecules[J],1987,20(7):1496 1500[13]　Kadiolu S.I.,Yilmaz L.,Ozbelge H.O..Separ.Sci.Tech.[J],2009,44(11):2559 2581[14]　Gregor H.P.,Luttinger L.B.,Loebl E.M..J.Phys.Chem.[J],1955,59(1):34 39[15]　Nishikawa H.,Tsuchlda E..J.Phys.Chem.[J],1975,79(19):2072 2076[16]　Wall F.T.,Gill S.J..J.Phys.Chem.[J],1954,58(12):1128 1130[17]　Achterberg E.P.,Holland T.W.,Bowie A.R..Anal.Chim.Acta[J],2001,442(1):1 14[18]　Wuhan University(武汉大学).Instrument Analysis,Version 4th(仪器分析,第四版)[M],Beijing:Higher Education Press,2000:328[19]　ZHANG Han⁃Qi(张寒琦),TIE Yuan(铁元),WANG Da⁃Ning(王大宁),ZOU Ming⁃Qiang(邹明强),CHEN Chao(陈超).The BriefHandbook of Analytical Chemistry(分析化学简明手册)[M],Changchun:Jilin University Press,1996:115[20]　CHEN Gui⁃E(陈桂娥),YAN Jian(阎剑),ZHANG Hai⁃Bin(张海滨),XU Zhen⁃Liang(许振良).Journal of East China University ofScience and Technology(Natural Science Edition)(华东理工大学学报,自然科学版)[J],2007,33(2):167 171[21]　Rivas B.L.,Pooley S.A.,Pereira E.D.,Cid R.,Luna M.,Jara M.A.,Geckeler K.E..J.Appl.Poly.Sci.[J],2005,96(1):222 231[22]　Cojocaru C.,Zakrzeska⁃Tranadel G.,Jaworska A..J.Hazard.Mater.[J],2009,169(1 3):599 609Measurement of Complexation Stability Constant and Coordinating Number of Poly (ethylenimine )with MetalsHUANG Jia⁃Hua 1,2,GONG Zhen⁃Bin 1,3*,LIN Ji⁃Jun 2,DUAN Hua⁃Ling 2(1.State Key Laboratory of Marine Environmental Science ,2.College of Ocean and Earth Sciences ,3.College of the Environment and Ecology ,Xiamen University ,Xiamen 361005,China )Abstract A rapid and accurate method using polymer complexation ultra⁃filtration(PC⁃UF)technique and inductively coupled plasma mass spectrometry(ICP⁃MS)for the measurement of the complexation stability con⁃stant and the average coordination number of poly(ethylenimine)(PEI)groups participating in the complex formation of PEI with metal ions was proposed.The method was applied to determine the stability constant and the average coordination number of PEI and Cd 2+complex.Firstly the mixture of various initial concentration ratios of PEI and Cd 2+solution were prepared,respectively,then the mixture reacted until the complexation equilibrium reached,and at last Cd 2+and small components were permeated into the solution and PEI⁃Cd com⁃plex was hold back with centrifugal ultra⁃filtration kit.Then ultra⁃filtration followed was completed so as to de⁃compose PEI⁃Cd complex and obtain Cd 2+species using 10mL 3%(volume fraction)HNO 3.With the help of chemical model inferred in the study,the complexation stability constant and the average coordinating number of PEI⁃Cd could be calculated.Effect of pH value(pH =4.0 5.9)on the equilibrium was investigated.The results showed that the complexation stability constant and the average coordinating number of PEI⁃Cd became larger as pH value increases.This may due to the protonation of PEI reduces as pH values increase,then the binding ability of PEI with metals become stronger.Keywords Poly(ethylenimine);Complexation stability constant;Coordinating number;Ultrafiltration tech⁃nique;Inductively coupled plasma mass spectrometry (Ed.:I ,S ,K )7362　No.12　黄佳华等:聚乙烯亚胺⁃金属络合物的稳定常数及配位数的测定。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。