中国北方绵羊基因组拷贝数变异研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国北方绵羊基因组拷贝数变异研究
侯成林;王伟;周欢敏;张焱如;曹俊伟
【摘要】为寻找绵羊基因组中可能的遗传性状相关标记,本试验采用比较基因组杂交(comparative genomic hybridization,CGH)芯片技术,构建了蒙古羊、哈萨克羊、藏羊的拷贝数变异(copy number variation,CNV)多样性图谱.试验结果显示,共检测出28个CNV区域(CNV region,CNVRs),包括11个扩增型、15个缺失型和2个扩增—缺失型.通过功能注释和代谢通路分析发现,在蒙古羊和藏羊基因组中血红蛋白基因存在拷贝数扩张,可能与两种绵羊长期生活在高原低氧环境中产生的适应性有关.对CNVRs和CNV相关基因进行实时荧光定量PCR检验,83.3%的实时荧光定量PCR结果与芯片检测结果一致.通过对中国北方3种绵羊的基因组CNV的研究,为不同绵羊品种间遗传变异的研究奠定了基础.
【期刊名称】《中国畜牧兽医》
【年(卷),期】2016(043)003
【总页数】7页(P784-790)
【关键词】绵羊;拷贝数变异;比较基因组杂交;实时荧光定量PCR
【作者】侯成林;王伟;周欢敏;张焱如;曹俊伟
【作者单位】内蒙古农业大学生命科学学院,呼和浩特010018;包头轻工职业技术学院,包头014030;内蒙古农业大学生命科学学院,呼和浩特010018;内蒙古农业大学生命科学学院,呼和浩特010018;内蒙古农业大学生命科学学院,呼和浩特010018;内蒙古农业大学生命科学学院,呼和浩特010018
【正文语种】中文
【中图分类】S813
在高等生物中,复杂性状一般情况下是由多个等效基因与环境因素共同作用引起的,具有明显的表型复杂性、遗传异质性等特征,一般称为表观遗传性状。
2004年,多个有关“人类基因组计划”研究机构都发现,正常个体间部分基因的拷贝数存在差异的情况[1-2]。
基因拷贝数变异(copy number variation,CNV)主要指与参考基因组相比,由于大片段的插入、缺失或复制所造成的DNA序列的变异。
如果在群体中CNVs的发生频率大于1%,这种结构变异也可叫做拷贝数多态性(copy number polymorphism,CNPs)。
随着对CNVs相关研究的不断深入,发现CNVs与多种疾病密切相关。
CNVs在复杂性状的发生过程中起重要的作用,被认为是生物体遗传变异和表型差异的重要来源和原因[3]。
如今,越来越多研究证实,CNVs不仅普遍存在于人类中,而且在哺乳动物和植物中也广泛存在。
随着基因组检测技术的发展,目前在全基因组范围内检测CNVs的方法一般有3种,分别是比较基因组杂交技术(array comparative genomic hybridiztion,aCGH)、SNP微阵列方法和高通量直接测序方法。
aCGH技术是CNVs检测的经
典方法,该技术具有信噪比高、准确性好、探针覆盖全基因组等优点。
该技术需在同一张芯片上将对照样本和试验样本标记上不同荧光素,进行杂交,根据信号值的不同来确定拷贝数的差异[4]。
近年来,随着点样技术的成熟,常用探针长度为25~80 bp的寡核苷酸探针CGH芯片用于CNVs的检测,以Nimblegen和Agilent公司的芯片为代表[5]。
目前,家畜基因组CNVs中关于牛的研究相对较多,且已取得一些进展,但绵羊
和山羊的CNVs研究较少。
绵羊首个比较基因组CNVs的图谱是利用牛基因组信
息设计的芯片进行跨物种杂交获得的,在不同品种的11个个体中检测到186个
CNVs[6]。
该试验在设计时,绵羊基因组序列尚未公布,采用的是牛基因组序列。
由于绵羊与牛基因组序列之间存在差异,跨物种的检测方式可能影响到结果的准确性。
另一项关于绵羊CNVs的研究是利用Ovine SNP 50K BeadChip芯片,通过PennCNV软件对绵羊基因组进行分型检测,构建了绵羊的CNVs图谱。
但该技术不及aCGH技术精确,不同的算法得到的结果差别较大,因此,对绵羊复杂性状表型变异的研究还需对基因组做更全面的了解。
蒙古羊、哈萨克羊和藏羊是中国北方最古老的绵羊品种,这3种绵羊具有很强的环境适应性,具有抗寒、耐旱、抗病力高等优势,基因组中蕴藏着大量的与优异性状相关的基因序列,具有极其重要的育种价值和巨大的潜在经济价值。
本研究利用绵羊基因组信息来设计探针,采用aCGH技术对3种古老的绵羊品种进行了全基因组CNVs的检测,为研究绵羊基因组CNVs与其性状之间的关联性奠定基础。
1.1 样本收集
本研究中芯片杂交试验所用的绵羊包括蒙古羊、哈萨克羊和藏羊各1只,选用1只杜泊羊作为对照。
从所有试验羊颈静脉处采集10 mL血液,注入已加入抗凝剂的15 mL离心管内,并于-80 ℃冰箱保存备用。
1.2 主要试剂与仪器
血液基因组DNA提取试剂盒购自Axygen公司;其余试剂均购自宝生物工程(大连)有限公司。
Thermo基因含量测定仪购自赛默飞世尔科技公司。
本试验所采用的芯片是由Roche公司定制的3×1.4 M绵羊全基因组CGH芯片,芯片序列依据特克赛尔羊Ovis_aries_1.0(http:
///genome/83)的基因组信息进行设计。
芯片杂交及数据处理工作由北京博奥生物有限公司完成。
芯片共包含约1.4 M的探针,探针的平均间距为1 961 bp。
1.3 基因组DNA的提取
用DNA提取试剂盒进行绵羊基因组DNA的提取,用加入溴化乙锭的1.0%琼脂糖凝胶电泳检测gDNA的完整性,凝胶成像系统上观察并拍照。
用Thermo基因含量测定仪检测gDNA的含量。
1.4 芯片杂交及数据处理
3个品种基因组DNA与绵羊CGH芯片杂交。
原始数据采用NimbleScan 2.6软件进行图像分析,将图像信号转化为数字信号。
首先对数字信号进行LOESS空间校正和q-spline归一化处理,目的是为了提高芯片检测的准确性,减少假阳性,接着使用SignalMap软件对数据进行进一步分析和可视化处理。
最后采用segMNT算法对差异片段进行分析,将|mean Log2ratio|≥0.25并且包含5个及5个以上连续探针的片段作为一个CNV,并根据这些片段的平均Log2ratio判断CNV的类型:|Log2ratio|<0.25表示“无变化”;Log2ratio≥0.25表示“扩增”;Log2ratio≤-0.25表示“缺失”。
1.5 基因功能富集分析
根据特克赛尔羊Ovis_aries_1.0的基因组数据库进行CNV区域内基因注释。
由于绵羊基因组中仍有少量基因未被注释,本试验将这些基因的IDs转换为人或小鼠的基因IDs。
为了鉴定这些CNV相关基因的功能,利用DAVID (The database for annotation,visualization and integrated discovery)在线软件(http:
///)进行GO和KEGG (kyoto encyclopedia of genes and genomes)功能富集分析[7]。
为了检测CNVs中是否存在有孟德尔遗传特性的基因,本试验将这些基因与在线人类孟德尔遗传(Online Mendelian Inheritance in Man,OMIM)和在线动物孟德尔遗传(Online Mendelian Inheritance in Animal,OMIA)数据库比较,以检测CNV相关基因与遗传性状的相关性。
1.6 实时荧光定量PCR验证
利用实时荧光定量PCR方法对CGH检测到的CNVs进行验证,以杜泊羊基因组DNA为对照组,每个品种绵羊各从同一种群中选择6个不同个体组成试验组,进行定量分析。
利用软件进行引物设计,共设计了2对候选CNV区域(CNV region,CNVRs)和2对基因(HBB、ASIP)的引物,以及内参GAPDH的引物(表1)。
所有
的实时荧光定量PCR反应均是采用SYBR Green方法,反应体系为20 μL:基因
组DNA 20 ng,SYBR Premix EX Taq Ⅱ 10 μL,上、下游引物(10 μmol/L)各0.4 μL,双蒸水补至20 μL。
Real-time PCR反应条件:95 ℃预变性5 min;95 ℃变性60 s,60 ℃退火40 s,40个循环;72 ℃延伸60 s,72 ℃进行荧光信号的
收集。
采用相对定量法进行试验样品与对照样品的相对拷贝数分析,Ct值为3次
试验重复的平均数,并且经过与内参引物(GAPDH)的归一化。
最后,利用2-ΔΔCt 算法计算试验样品基因组DNA的相对拷贝数。
2.1 基因组CNVs的检测
2.1.1 CNVs和CNVs相关基因的检测本试验利用aCGH芯片对3个绵羊品种(蒙古羊、藏羊、哈萨克羊)进行CNVs的检测,以杜泊羊作为对照,特克赛尔羊基因组作为参考基因组。
在3个品种的26对常染色体和X染色体上,一共检测到了197个CNVs,CNVs的详细信息见表2。
其中,哈萨克羊中鉴定的CNVs数目最多(共123个,缺失86个,扩增37个),蒙古羊中鉴定的CNVs数目最少(共82个,缺失61个,扩增21个)。
将只在单一品种内检测到的CNVs定义为品种特有的CNVs,其数量分别为16(蒙古羊)、33(哈萨克羊)及23(藏羊)。
在所有的绵羊品种中,有大约36.55%的CNVs (72个)仅在1个品种中被观察到。
CNVs总的碱基数在不同品种中也有很大差异,最短的为蒙古羊,最长的为哈萨克羊,分别为
6.55和11.26 Mb。
CNVs的平均碱基数最短的为蒙古羊,最长的为藏羊,分别为79.90和98.05 kb。
本试验中,所有的CNVs共鉴定出1 495个基因,蒙古羊中CNVs相关基因的数目最多,达789个,450个基因至少在两个品种中发现,这
些基因大多已被鉴定,如MHC Class Ⅰ基因、细胞色素 P450基因、嗅觉受体(ORs)等。
为确认这些结果,本试验选取了2个CNVRs和2个CNVs相关基因,通过实时荧光定量PCR方法进行了验证。
2.1.2 CNVRs的分布与特征将重叠的CNVs合并,共得到了28个CNVRs,
包括11个(39.29%)扩增型,15个(53.57%)缺失型和2个(7.14%)扩增—缺失型(图1)。
这28个CNVRs长度变化范围从52 kb到1.98 Mb,平均值和中位值分
别为378.3和101.4 kb。
这些CNVRs的总长度约为10.59 Mb,占绵羊基因组总长度的0.60%。
CNVRs在染色体上的分布并不均匀,在2、6、12号等10个染
色体上并未检测到CNVRs的存在。
染色体长度与CNVRs的发生率不存在相关性,如最长的1号染色体包含1个CNVRs,而20号染色体(长度为1号染色体的1/5)包含数量最多的7个CNVRs。
另外,不同染色体上CNVRs的覆盖度也非常不同,7、10、15、16和20号染色体上CNVRs的覆盖度大于1%,其中10号染色体
覆盖度最大,为5.71%。
将28个CNVRs按照长度分为0~100、100~200、200~300、300~500
及>500 kb 5部分,统计发现位于100~200 kb范围内的CNVRs数目最多,有
8个(28.57%),大于500 kb的CNVRs有6个(21.43%)(图2)。
2.2 CNVs相关基因的功能分析
3个品种绵羊中共检测到1 495个CNVs相关基因,为了确认所有这些基因的生
物学功能,运用DAVID软件对这些基因进行了基因聚类(GO)分析,所有基因被分为3个主要类群,分别是“生物学功能”、“细胞组分”、“分子功能”。
在这
些CNVs相关基因中,大多数与嗅觉和嗅觉受体活性相关。
除此以外,还包括G
蛋白偶联受体信号通路、紧密连接、免疫应答、细胞色素P450等。
运用DAVID
软件对CNVs相关基因进行KEGG通路分析,其中共有209个基因对应到嗅觉传导信号通路中。
除此之外,本试验在蒙古羊和藏羊CNVs相关基因中发现HBB基
因,该基因编码血红蛋白β亚基。
本试验检测了CNVs相关基因与动物孟德尔遗传性状的相关性。
将这些基因与OMIM和OMIA数据库比较,发现仅有AS1P基因出现在这两个数据库中。
该基因定位于13号染色体,与绵羊黑色素生成和皮毛颜色的调控相关。
2.3 Real-time PCR验证
从aCGH方法检测到的28个CNVRs中选择2个CNVRs和2个CNVs相关基因,这些CNVRs或CNVs基因为不同的拷贝数变异类型。
每个绵羊品种,分别选择6个不同的个体进行实时荧光定量PCR试验。
采用相对比较循环阈值(Ct)法,结果
表明83.30%的实时荧光定量PCR结果与CGH芯片结果一致(图3),因此可以认为,aCGH芯片的CNV检测结果是可靠的。
本研究中利用aCGH方法对3个绵羊品种进行了全基因组CNVs检测,共发现了28个CNVRs。
经检测,CNVRs与染色体的长度没有相关性,且在2、6、12号
等10个常染色体上没有发现CNVRs。
这一结果远少于刘佳森等[7]使用SNP50
芯片技术对绵羊基因组的检测结果,且只有3个CNVRs与该研究结果有重合。
一个可能的解释是SNP分析平台有更高的分辨率,且该试验中检测样本更多。
由于aCGH方法存在参考基因组,因此在假阳性方面优于SNP芯片技术。
除此之外,
由于本研究中试验动物相对较少,CNVRs的数量和绵羊基因组的多样性很可能被
低估。
缺失的CNVRs长度为6.03 Mb,扩张的CNVRs的长度为4.39 Mb,缺失的范围大于扩张的,这样的结果与之前的相关研究一致,该研究认为进化过程中基因发生缺失的可能性要大于扩张。
缺失比扩张更易发生可能是由于以下两个原因,即分子机制和技术偏好性。
首先,非等位基因同源重组(NAHR)可能是CNVs产生的主要机制,该过程产生缺失的概率要远远高于产生扩张的概率[8]。
第二,根据
以前的研究结果,aCGH检测方法似乎更易检测到缺失[3,9]。
本研究检测到CNVRs的总长度约为10.59 Mb,占绵羊基因组总长度的0.60%,这表明基因结
构变异在绵羊基因组中是普遍存在的,是遗传变异的重要来源。
拷贝数变异在许多研究中被证实与生物的表型相关[10-12],CNV相关基因主要通过剂量效应影响表型变异。
本试验对CNVs相关基因的功能分析结果显示这些基
因有重要的生物学功能和遗传多样性。
GO和KEGG统计结果揭示,CNV相关基
因大量涉及嗅觉受体蛋白家族,该家族是哺乳动物中最大的蛋白家族,这与猪、马、牛等基因组CNV研究结果类似[13-15]。
功能分析结果表明许多CNVs相关基因
与免疫系统相关。
在蒙古羊和藏羊中HBB基因拷贝数高于哈萨克羊,HBB基因编码血红蛋白β-亚基,在氧气转运过程中起重要作用。
这个结果与牦牛基因组研究
的结果相一致[16]。
通过对牦牛和牛的基因组比较,牦牛基因组中与缺氧和能量代谢相关的基因家族有扩张。
本研究中HBB和CYP2P基因在不同绵羊品种中存在
选择性扩张,这对于高海拔和低氧环境中绵羊的适应性起到很重要的作用。
Fontanesi等[17]在山羊中证实,ASIP基因的缺失与被毛的颜色相关,Doan等[18]在对马的拷贝数变异研究中发现ASIP基因与银色皮毛形成相关。
在本研究中,该基因同样存在拷贝数变异的现象,是否与表型相关还需更进一步研究。
本研究对中国北方3个绵羊品种的CNVs进行了初步的研究,在基因组内鉴定了
大量变异,证明CNVs对许多生物学功能具有重要影响。
这些数据为以后研究遗
传变异与绵羊的抗寒、疾病抗性和对高海拔的适应性等之间的关系奠定了基础。