猪核线粒体假基因的分布特征研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
核生物基因组存在线粒体假基因现象。猪线粒体假基因在核基因组中的分布尚未见报道。研究通过猪线粒体基因
组全序列与核基因组全序列进行比对,由BLAST程序鉴别出132个NUMT。结果表明:这些NUMT的大小在37~4 453
bp,其中90%的NUMT长度处于40~1 000 bp的范围内,NUMT与相应的线粒体DNA片段之间的同源性数值范围为
比对所得的NUMT长度为37~4 453 bp,与其对 应 的 mtDNA 片 段 序 列 相 似 度 高 达 66 % ~ 100 %(如 图 1 所示)。其中90%的NUMT长度处于40~1 000 bp的范 围内,其中尤以50~500 bp的NUMT居多。
2.1 猪NUMT的分布特征 由NCBI网站提供的在线
而对于编 码 tRNA 的 序 列 ,使 用 DNA mfold web server 预 测 mt -tRNA 及 对 应 的 NUMT -tRNA 在 37℃ 下 折叠形成的二级结构来进行分析发现,如图3所示, 正常mtDNA片段可以折叠成具有转运活性的三叶草 结 构 ,而 NUMT 片 段 由 于 序 列 存 在 变 异 ,无 法 折 叠 形 成与mtDNA对应序列一致的二级结构,而且呈现出 不稳定的高自由能二级结构,从而可以推断其不具 备正常的转运功能。
37
畜 牧 生 物 技 术 ·Anima l S cie nce & Biote chnology
2011年 第 47 卷 第 17 期
edu/提供的在线服务DNA mfold web server,预测mttRNA及对应的NUMT-tRNA 在37℃下折叠形 成的二 级结构,参数选择缺省值。
2结果
BLAST 服 务 得 到 的 结 果(RID 为 H8P5EASC015)显 示
有132处NUMT。这些NUMT片段全长49 391 bp,约为
线 粒 体 基 因 组 长 度 的 3 倍 , 分 别 定 位 于 猪 1 、4 、5 、7 、
11、13、14、15、17号染色体上,分布情况见表1。有近
到错误的研究结果。在一些DNA序列数据库中,也存 在着假基因被误当作功能基因的现象。
本 研 究 以 阐 明 猪 的 NUMT 分 布 并 分 析 其 对 应 的 mtDNA为主要目的,获得猪NUMT分子特征信息,为 NUMT和mtDNA的研究和应用提供重要的研究背景。
1 材料与方法
1.1 NUMT的搜索 使用NCBI网站提供的序列比对 工具BLAST。将猪线粒体DNA基因组序列(序列号为 NC_000845.1) 作 为 查 询 序 列 ,对 Reference genomic sequences (refseq _ genomic)数据库进行比对,限制物 种 为 Sus (taxid:9822),运 算 法 则 选 择 Somewhat similar sequences (blastn)。为确保结果具生物学意义,将期 望值e限定为低于10-4 [2],不选择任何filter选项,记分 矩阵、匹配分值、空位罚分等则使用默认参数。若 NUMT序列与其对应的mtDNA序列匹配,将被并列在 一起作为一条结果输出。 1.2 搜 索 结 果 的 验 证 选 择 对 数 据 库 non -human, non -mouse ESTs (est_others) 重 复 检 索 和 比 对 ,确 保 前次比对获得的结果均为来自核基因组的序列信 息 , 并 将 所 得 序 列 结 果 通 过 在 线 DNAMAN(http:// /)分析序列特征。 1.3 tRNA 二 级 结 构 预 测 获 取 NUMT 所 对 应 的 mtDNA 序 列 片 段 后 ,选 择 其 中 所 包 含 的 完 整 tRNA 序 列 进 行 二 级 结 构 预 测 。 使 用 http://mfold.bioinfo.rpi.
中图分类号:S828.2
文献标识码:A
文章编号:0258- 7033(2011)17- 0037- 05
核线粒体假基因(nuclear mitochondrial DNA,NUMT) 由 Lopez 等 [1] 在 研 究 猫 科 动 物 线 粒 体 基 因 组 中 首 先 发 现并命名。随着越来越多物种的线粒体基因组全序 列测定,NUMT已经在动 物、植物、真菌的 数 百 个 物 种 中 直 接 得 到 验 证 ,可 以 说 ,NUMT 广 泛 存 在 于 真 核 生物的基因组中。
3讨论
逐一分析比对所得到的各个NUMT后可确定,这 些NUMT都不具备转录活性。NUMT表现出多个提前 终止密码子和失去原有的二级结构的现象是因为, 与mtDNA序列比较,受不同突变约束的NUMT显示出 不同的进化模式和遗传模式。从DNA 序列进化 来 看,由于没有净化选择,NUMT进化特性不同于mtDNA。 NUMT 序 列 的 核 苷 酸 替 代 随 机 性 更 大 [3],基 本 没 有 密 码 子 偏 向 性 ,与 功 能 基 因 相 比 ,NUMT 的 同 义 突 变 比 例更低,突变位点呈平均分布,由碱基插入或缺失并 造成移码突变的现象更为常见,且常出现终止密码 子 等 功 能 基 因 中 不 能 容 忍 的 有 害 突 变 [4]。 随 着 插 入 核基因组时间 的 不 同 ,NUMT 的 进 化 程 度 也 有 所 不 同。
绝大多数假基因不具备生物学功能,NUMT也是 如此,缺乏基因表达所需的启动子和其他调控元件, 没 有 转 录 活 性 , 目 前 也 没 有 关 于 NUMT 的 功 能 活 性 的 研 究 报 道 。 正 是 由 于 NUMT 携 带 着 物 种 祖 先 线 粒 体的遗传信息,不参与细胞功能活动,却有着与线粒 体基因不同的进化特征,在进化过程中不受选择压 力 的 影 响 ,突 变 完 全 是 随 机 的 ,因 此 ,在 物 种 进 化 和 比较基因组学研究中作为“分子化石”成为最强有力 的研究工具之一。同时,NUMT也给分子生物学研究 带 来 了 一 些 不 便 。 由 于 NUMT 和 与 其 对 应 的 线 粒 体 基 因 存 在 高 度 同 源 性 ,在 进 行 针 对 线 粒 体 DNA 的 PCR 扩 增 、探 针 杂 交 等 研 究 应 用 时 ,引 物 或 探 针 可 与 NUMT 结 合 而 导 致 产 物 中 出 现 非 目 的 序 列 , 从 而 得
而对于编码trna的序列使用dnamfoldwebserver预测mttrna及对应的numttrna在37下折叠形成的二级结构来进行分析发现如图3所示正常mtdna片段可以折叠成具有转运活性的三叶草结构而numt片段由于序列存在变异无法折叠形成与mtdna对应序列一致的二级结构而且呈现出不稳定的高自由能二级结构从而可以推断其不具备正常的转运功能
此外,进一步分析了比对所获得的NUMT两侧的 标记,结果见表2。可见,这些NUMT都不在功能基因 区域范围内,被标记所包含的几个结果,其标记都是 前人发现的假基因标记。
39
畜 牧 生 物 技 术 ·Anima l S cie nce & Biote chnology
2011年 第 47 卷 第 17 期
50%的NUMT分布于14号染色体上,说明不同染色体
对NUMT插入的敏感程度不同。
表1 猪NUMT在染色体上的分布情况
染色体 14 1 4 7 13 5 15 11 17
NUMT 数量 60 22 16 10 8 5 5 3 3 132
图1 NUMT与对应mtDNA序列的一致性百分比对NUMT长度
2.2 NUMT 的 分 子 结 构 特 征 猪 NUMT 所 对 应 的 mtDNA 序 列 在 线 粒 体 基 因 图 谱 上 也 不 是 均 衡 分 布 的。使用DNAMAN软件分析这 些 比 对 结 果 发 现 几 乎 线粒体基因组全序列各段都以不同的拷贝数插 入到核基因组中,但线粒体基因组的一些区域比 其他区 域 在 NUMT 中 的 拷 贝 数 高 出 许 多 ,例 如 16S rRNA、ND1 基 因 区 域 有 多 达 数 十 个 拷 贝 的 NUMT 存 在 , 而 ND3、ND6 等 一 些 区 域 则 只 对 应 少 数 几 个 NUMT。各段NUMT序列分别对应mtDNA的位置见图 2所示。
25
32590365
LOC1001548 20793084..
LOC1001560 21301446..
14
否
是
05
21123130
46
21302815
LOC1001522 59481341..
LOC1001574 59607612..
14
是
否
74
59519177
98
59543534
LOC1001569 32152751..
表2 比对所得大于1kb的NUMT片段在基因组中的标记位置
NUMT 序号
132
NUMT 起始
32529085
130
21301072
131
59517400
129
32538026
126
59515519
127
45325684
128
45433423
125
118902730
124
30974973
123
118919511
—— —— —— —— —— —— —— —— —— —— —— —— —— — 收稿日期:2010- 04- 26;修回日期:2010- 07- 19 资 助 项 目 :国 家 高 技 术 研 究 发 展 计 划(2006AA10Z1A2);国 家 科 技 支撑计划 (2008BADB2B01);转基因生物 新 品 种 培 育 重 大 专 项 (2008ZX08009- 002);973 计划项目(2006CB102100) 作者简介:方迟(1984-),女,硕士研究生 * 通讯作者
38
2011年 第 47 卷 第 17 期
Anima l S cie nce & Biote chnology· 畜 牧 生 物 技 术
图3 NUMT及其对应mtDNA的tRNA二级结构预测示例
值得注意的是,有30个完整的线粒体基因存在 于 35 个 NUMT 片 段 中 ,其 中 包 括 9 个 编 码 蛋 白 质 的 基 因 ,分 别 是 ND1、ND3、ND4L、ND4、ND5、ND6、CYTB、 COX1 和 ATP8,21 个 编 码 线 粒 体 tRNA 的 基 因 (Ala、 Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu1、Leu2、 Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、Val)。 2.3 对 应 功 能 基 因 的 NUMT 序 列 特 征 使 用 DNAMAN 在 线 软 件 进 一 步 分 析 这 9 个 编 码 蛋 白 基 因 对 应 的 NUMT 序 列 , 发 现 无 论 使 用 通 用 密 码 子 或 脊 椎动物线粒体基因密码子都出现多个终止密码子, 因此这些基因无法被翻译转录形成功能蛋白。
66%~100%。此外,鉴定出的N U MT 序列几乎涵盖了包括线粒体DN A控制区在内的全部线粒体基因组,包括 30个
完整的线粒体基因,分布于猪的1、4、5、7、11、13、14、15、17号染色体上,近50%的 NUMT定位在14号染色体上。
关 键 词 :猪核线;序列比对;线粒体DN A;核基因组
注 :图 示 各 个 NUMT 所 对 应 的 线 粒 体 基 因 。 图 中 横 轴 为 猪 线 粒 体 基 因 组 ,纵 轴 表 示 猪 NUMT 长 度 分 布 范 围 ,两 轴 之 间 的 线 段 表 示 猪 的 132 条 NUMT ,线 段 长 度示意NUMT长度
图2 猪NUMT与线粒体基因组对照图
122
21159042
NUMT 长 度 /bp
4453 1759 1779 1461 1361 1426 1428 1335 1301 1227 1024
染色体
标记
上游 起止
包含
标记
下游 起止
包含
LOC1001569 32152751..
LOC1001568 32654816..
14
否
否
65
32087333
2011年 第 47 卷 第 17 期
Anima l S cie nce & Biote chnology· 畜 牧 生 物 技 术
猪核线粒体假基因的分布特征研究
方 迟,刘玉方,赵兴波* (中国农业大学动物科技学院,北京 100193)
摘 要:核线粒体假基因( NUMT)是线粒体DNA插入到核基因组中的DNA片段。目前,已经发现越来越多的真