新生儿耳聋基因检测数据集编制说明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《新生儿耳聋基因检测数据集》
编制说明
一、背景介绍
1.新生儿耳聋基因检测介绍
耳聋是临床常见疾病,也是新生儿常见出生缺陷之一。
常规的新生儿听力筛查通过物理学技术只可检查宝宝当时的听力状况,但对于新生儿体内的遗传物质(即耳聋基因)的改变而导致的听神经病、迟发性与药物敏感性耳聋无法及时检测到而失去早期干预和治疗的机会。
新生儿耳聋基因检测是通过荧光PCR、质谱、或者高通量测序等技术对新生儿耳聋相关基因进行检测,精准判断新生儿耳聋基因是否存在缺陷的检测技术。
通过采集新生儿微量血液样本,提取DNA进行检测,根据检测结果,评估新生儿患听力障碍的疾病风险。
此技术能同时检测先天性、迟发性、听神经病与药物敏感性耳聋等非综合征型耳聋和发病率高或以听力障碍为首发的综合征型耳聋基因。
听力与耳聋基因联合筛查,可为临床医师及父母提供更为全面的新生儿听力护理及诊疗指导。
2.新生儿耳聋基因检测应用
耳聋是影响人类健康的一种常见疾病,也是临床上常见的遗传性疾病。
研究表明,遗传性耳聋约占耳聋患者的60%。
据统计,平均每100个中国人中,会有高达5-6人出现常见耳聋基因异常,包括受累者(即存在较高的听力损失风险),及携带者(一般不会表现出听力损失)。
2013年召开的世界卫生组织全球防聋合作中心会议暨中国听力论坛上报告显示,我国现有听力残疾者2780万人,其中,0~6岁听障儿童约13.7万,且每年以2.3万的数量递增,而其中至少一半的聋儿是由于遗传缺陷引起的,可见遗传因素在致聋中所起的重要作用。
新生儿阶段及早发现这些耳聋致病基因受累者,使得部分语前听力损失、迟发性语后听力损失以及药物性聋易感患者得到准确的遗传学诊断,能够实现对这些聋病进行有效的预防、控制或治疗。
因此,正确做出病因分析,提出早期干预措施,是降低耳聋发生的有效途径。
二、工作简况
1.任务来源
2020年4月,由深圳标准化协会批准《新生儿耳聋基因检测数据集》立项。
本标准由深圳华大基因软件技术有限公司提出,由深圳市标准协会归口,起草工作组由深圳华大基因软件技术有限公司、深圳华大临床检验中心、深圳华大基因股份有限公司、武汉普仁医院青山区武东街西区社区卫生服务中心、新乡医学院医学检验学院共同组成。
2.编制背景、目的和意义
耳聋是影响人类健康的一种常见疾病,也是临床上常见的遗传性疾病。
研究表明,遗传性耳聋约占耳聋患者的60%,其中75%-80%为常染色体隐性遗传,10%-20%为常染色体显性遗传,其余为X连锁和线粒体遗传等。
流行病学调查显示,我国遗传性耳聋人群以GJB2、GJB3、PDS和线粒体12S rRNA基因突变为主。
此外,我国幅员辽阔,各地区在耳聋基因突变热点的分布频率上有一定差异。
通过对新生儿进行听力筛查和耳聋基因筛查,了解当地正常人群中遗传性耳聋所占比例及常见耳聋基因突变位点的分布,筛选检出率较高的致聋突变位点和未见常见耳聋基因突变位点的病例,为减少耳聋患者提供依据。
听力障碍的发现早晚还是影响语言能力的最重要因素,通过早期诊断和干预能够提高听力障碍儿童的语言、语音水平。
然而,我国当前的新生儿耳聋基因检测数据还存在不同程度的缺失,如:
1、地址、联系方式等个人信息缺失,将严重影响筛查出可疑结果的后续指导。
药物敏感突变位点的筛查,对于新生儿出生后的用药安全具有重要的指导意义。
对于检测出GJB2基因突变而无其它神经及听觉中枢障碍者,可通过尽早人工耳蜗植入,提高听力语言康复效果。
对于可引起大前庭水管综合征的SLC26A4基因IVS纯合突变人群,虽然出生时可能听力正常,但是在日常生活中需要避免头部受到碰撞、重击,以减慢或避免耳聋的发生。
对于线粒体DNA12S rRNA 突变引起的药物性耳聋易感者,提供生活指导卡片避免接触相关药物,减少药物性耳聋发生。
2、检测技术和方法的不统一,将导致假阳性率增高,而无法准确预知部分
遗传相关的迟发性耳聋。
3、家族病史及表型等信息缺失不利于后续病因分析。
4、检测分析及结果判读不一致,有可能导致漏检错检。
5、知情同意不充分,导致受检者对检测必要性、检测范围、预期目的、局限性、潜在风险认识不到位,容易引起纠纷。
本标准规范了新生儿耳聋基因检测从个人信息、家族病史、受检者表型信息到耳聋基因20个常见高发位点检查结果信息。
根据不同数据类型定义不同的数据标准,规范化定义,提升数据可应用性,打通从数据产生到数据存储、数据分析、数据分享的信息壁垒。
为我国耳聋患儿的早期发现、早期诊断和早期治疗提供有力的数据支撑。
3.简要编制过程
1)前期准备
a.2019年6月,深圳华大基因软件技术有限公司成立了标准编制小组。
标
准编制小组对国内外新生儿耳聋基因检测标准的发展状况,发展趋势,
存在问题等进行全面系统调研。
对调研资料加以整理分析,起草标准的
初步框架。
b.2019年9月,召开第一次起草工作会议,初步确定标准编制的原则和标
准的框架内容,并根据会议结论,起草了标准的草案。
c.2019年11月,召开了第一次专家评审会议,根据专家意见修改了标准草
案。
2)标准立项
2020年4月,深圳市标准协会批准《新生儿耳聋基因检测数据集》的立项。
3)修改标准草案,形成征求意见稿
2020年6月,召开第二次起草组会议,主要讨论本标准的范围,此次研讨会后,经过修改形成工作组第二稿。
2020年8月,召开第三次起草组会议,主要研究讨论各条款的准确性、实用性和可维护性。
经过这次讨论,编制小组根据讨论结果进行修改,基本确定标准的内容。
此外,对标准的语言与格式进行了规范。
期间,编制小组也不断完善草案,进行内容上的更新,格式上的修改,以保证草案的质量。
4)提出征求意见稿、挂网征求意见
2020年11月,起草工作组将标准草案发送给医院、研究院等各单位的专家,就草案进行讨论,征求意见和建议。
同时,将草案投放在网络上,广泛征求生物、医疗等各领域人士的意见和建议。
结合各单位各专家对草案的反馈建议,修改完善草案,形成标准送审稿。
三、制标原则/依据和主要内容
1.制标原则/依据
1.1依法原则
即以现行法律法规的规定和相关标准为基础。
本标准中的约束性条款首先应与这些法律法规、强制性标准的要求保持一致,并在必要情况下予以细化和延伸,但总体上不得有悖于法律法规和强制性标准的要求。
1.2实用性原则
标准的编写结合了新生儿耳聋基因检测数据在数据采集、数据存储、数据治理等方面的实际情况。
标准的编制过程中,考虑了新生儿耳聋基因检测数据在数据生命周期内流通的基本原则和标准操作规程,便于推广应用。
1.3科学性、前瞻性
标准化的新生儿耳聋基因检测数据集对数据标准化存储、自动化治理、隐私化提供数据服务具有必要意义。
通过新生儿耳聋基因检测数据标准的信息化,并接入业务系统推动数据生命周期良性运转,同时,保障数据完整性和有效性,提升数据质量,确保数据能应用于后续的研究,让数据成为生产力,新生儿耳聋基因检测数据集必须是科学的,拥有一定前瞻性的。
2.主要内容
数据标准根据数据类型对数据进行规范化定义,不同类型数据不同数据标准方案。
新生儿耳聋基因检测数据的数据类型可分为非结构化数据和结构化数据。
其中结构化数据,通过数据元、值域来描述。
1)数据元目录:
以华大集团各体系数据为基础,通过对行业内数据生产平台试用调研,着重分析对比各平台数据分析、存储、治理及应用人员等项目,确定本标准数据元适用范围以及相关术语定义。
按照实际情况将数据元目录划分为个人信息元数据目录、检测过程信息元数据目录、表型信息元数据目录、送检信息元数据目录、检查结果信息元数据目录五大部分。
本部分罗列数据元应包含属性,包括状态、来源、基础数据集、基础数据元标识符、数据元中文名称、定义、必要性、信息保护、数据元的数据类型、表示格式、单位代码以及数据元允许值等。
2)值域代码
本部分根据数据元属性直接引用国标、行标、地标规定值域代码,若无现有标准则以华大集团数据为基础,通过专家访谈调查、行业数据库、行业主要厂商平台等最新发布数据编制值域代码。
遵循值域内容覆盖绝大部分值内容,包括历史数据以及实时数据。
本部分罗列数据元值域的包含属性,包括值域表标识符、值域代码、值域内容、值域说明。
3)标识符编码规则
数据元(DE)标识符采用字母数字混合码,包含数据标识符(DI)和版本标识符(VI)两级结构。
示例1:DI_V1
g)DI按照分类法和流水号相结合的方式,采用字母数字混合码。
按照数据元对应的主题分类代码、大类代码、小类代码、顺序码、附加码从左向右顺序排列。
其中:
——主题分类代码:用2位大写英文字母表示。
代码统一定为“DE”。
——大类代码:用2位数字表示,数字大小无含义。
——小类代码:用2位数字表示,数字大小无含义;无小类时则小类代码为00。
小类与大类代码之间加“.”区分。
——顺序码:用3位数字表示,代表某一小类下的数据元序号,数字大小无含义;从001开始顺序编码。
顺序码与小类代码之间加“.”区分。
——附加码:用2位数字表示,代表一组数据元的连用关系编码;从01开始顺序编码,附加码与顺序号之间加“.”区分。
无连用关系的数据元其附加码为“00”。
h)VI结构由4部分组成,为“V”+“m..m”+“.”+“n..n”。
其中“m..m”和“n..n”为两位阿拉伯数字构成,在数学上应是具有意义的正整数。
“m..m”表示主版本号,“n..n”表示次版本号。
示例2:“V1.2”表示主版本为第一版,次版本为“第二版”。
如果数据元更新前后可以进行有效的数据交换,则更新后主版本号不变,次版本号等于当前次版本号加1;如果数据元更新前后无法进行有效的数据交换,则更新后主版本号等于当前主版本号加1,次版本号归0。
四、国内外相关研究依据、技术标准
针对新生儿耳聋基因检测数据的分析、存储、治理及共享所依赖的数据标准,国内外尚没有制定该方面的国际标准、国家标准、行业标准和地方标准,本项目所制定的团体标准属于首次提出。
该标准作为新生儿耳聋基因检测数据存储、治理及共享方面的基础数据标准,填补该领域的空白。
数据标准涉及的数据文件格式标准情况如下:
1、国际标准情况:
高通量测序数据测序数据格式(即原始数据)国际GA4GH联合ISO立项发布流程中。
高通量测序数据信息分析数据格式,国际GA4GH联合ISO立项发布流程中。
2、国内标准情况:
WS/T376.3-2013儿童保健基本数据集第3部分:新生儿疾病筛查
SZDB∕Z122-2015新生儿听力与遗传性耳聋基因联合筛查标准
GB/T31074-2014科技平台数据元设计与管理
GB_T34798-2017核酸数据库序列格式规范求
GB/T35890-2018高通量测序数据序列格式规范
WS/T305-2009卫生信息数据集元数据规范
WS/T306-2009卫生信息数据集分类与编码规则
WS363-2011卫生信息数据元目录
WS364-2011卫生信息数据元值域代码
WS365-2011城乡居民健康档案基本数据集
WS370-2012卫生信息基本数据集编制规范
WS371-2012基本信息基本数据集个人信息
WS372-2012疾病管理基本数据集
WS375-2012疾病控制基本数据集
DB11/T1290-2015居民健康档案基本数据集
DB11/T1238-2015健康体检体征数据元规范
DB11/T320-2017公共卫生信息数据元属性与值域代码
《新生儿听力与遗传性耳聋基因联合筛查标准》规定了筛查对象和模式,筛查流程,筛查前宣传教育,筛查程序方面的内容。
1)没有涉及检测数据相关的数据存储,数据传输等信息,2)没有根据不同数据类型定义不同的数据标准和规范化定义。
五、标准中涉及的专利
无
六、产业化情况、推广应用论证和预期达到的经济效果等情况
标准编制团队考虑到数据标准的落地性问题是标准可执行的前提,论证并实施了新生儿耳聋基因检测数据标准的信息化,将标准通过接口嵌入至各生产系统。
挑选数据生命周期中三个比较关键的平台作为标准落地验证,分别为:数据产出
阶段的自动化分析平台、数据治理及存储阶段的数据仓库以及数据应用阶段的数据服务平台。
同时,针对新生儿耳聋基因检测数据特征,通过标准平台规范定义表型数据集通过数据仓库对接自动化分析平台,实现数据分析的自动化。
通过验证,结合IT、BT、DT技术数据标准可通过标准信息化并接入业务系统的模式实现标准落地,以标准带数据,实现存储标准化、治理自动化、管理可视化、系统灵活化,同时,管理员操作对象为数据标准,增强隐私保障。
通过新生儿耳聋基因检测数据标准的规范化约束、落地执行,必将对新生儿耳聋基因检测数据质量有大范围的提升。
同时,也促进了数据生命周期内各个阶段的有序衔接,为整个行业的发展打下坚实基础。
七、采用国际标准和国外先进标准情况,与国际、国外同类标准水平的对比情况。
我国乃至国际上,目前还没有针对新生儿耳聋基因检测数据采集、存储、治理的相关数据标准。
本标准参考《WS370-2012卫生信息基本数据集编制规范》设计数据集,本标准中的数据元设计依照《GB/T31074-2014科技平台数据元设计与管理》要求,参考《WS/T306-2009卫生信息数据集分类与编码规则》,并多次征集生物信息学领域的专家意见。
八、与现行相关法律、法规、规章及相关标准,特别是强制性标准的协调性
本标准从我国新生儿耳聋基因检测数据分析、采集、存储、治理的实际情况出发,参考了国内外相关资料,体现了科学性、先进性和可操作性原则,在制定过程中充分考虑国内相关的法规要求,与相关标准法规包括强制性标准协调一致。
九、重大分歧意见的处理经过和依据
本标准在编写过程中无重大分歧意见。
十、标准的属性
本标准属于推荐性标准。
十一、贯彻标准的要求和措施建议
在本标准通过审核、批准发布之后,由相关部门组织力量对本标准进行宣贯,在行业内进行推广。
建议本标准自发布6个月之后开始实施。
十二、废止现行相关标准的建议
无。
十三、其它应予说明的事项
该标准从我国新生儿耳聋基因检测数据分析、采集、存储、治理的实际情况出发,参考了国内外相关资料,体现了科学性、先进性和可操作性原则,综合评定达到了国际水平。