基因组多态性_单核苷酸多态性和_国际人类基因组单倍型图谱计划__cropped

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基因组多态性_单核苷酸多态性和_国际人类基因组单倍型
图谱计划__cropped
“?医学生物信息学专题杂志”专栏?
基因组多态性、单核苷酸多态性和“国际人类基因组单倍型图谱计划”
随着人类基因组测序计划的完成 ,人们进一步利用基因组测序的研究成果 ,深入地了解生命的基因现象 . 其中人类疾病基因组研究是一重要课题 ,并已取得了成果. 复杂性疾病是多个微效基因作用累加 ,个体对疾病的易感性并在特定的环境因素下诱发发病 . 这些基因的 SNPs 及其特定组合是研究疾病基因组的重要内容.
() 个体基因组差别称为基因组多态性 gene polymorphism个体差异必须从不同个体 DNA 序列的差异上阐明人类基因的多态性 ,才能真正了解与疾病特别是多基因疾病有关的遗传机制 ,同时深入了解人类起源、进化和迁徙过程中的 DNA 序列变化. 任意两个人之间的 DNA 核苷酸差异约占基因组的 0 . 01 %. 按人类基因组共有 30 亿对碱基计算 ,将有 300 万核苷酸位点的不同. 就是这基因组中万分之一的差异 ,决定了人类的遗传多样性.
基因的多态性 ,又可分为正常型和异常型 ,当存在异常型时 ,可直接导致疾
病 ,成为容易患病的危险因子 ,或者影响对药物敏感性 ,不同个体对药物产生不同的反应. 基因变异存在的事实 ,且数量之多 ,其研究
重点是 :弄清楚基因变体的生物学功能及其对生命、健康和疾病的意义. 如对癌症、心血管病等的易感基因
还不清楚了解 ,希望从对基因变异功能的研究去提高对上述疾病发病机理的认识.
基因多样性是整个生物医学研究中的组成部分 ,对复杂疾病的发生发展过程的基因定位、疾病发生的分子遗传机理、环境因子易感基因的检出、药物设计和用药均有极重要的意义. 基因组多样性研究是免疫
基因组学、药物基因组学、环境基因组学和预防医学等的主要内容之一.
( 基因组多态性在阐明人体对疾病、毒物的易感染与耐受性、疾病发生发展及临床表征的多样性 Clini2
) cal phenotype diversity在个体对药物治疗的反应及预后上起着重要作用. 所以对疾病基因多态性研究可以揭示疾病的不同临床表型 ,也可作为实行个体化治疗的根据. 对大数量基因变体的深入研究 ,将对生命、健康和疾病均有重要的意义.
( 在个体基因组的差异中 ,大多数属于 DNA 链上的单个核苷酸的不同 ,称为
单核苷酸多态性 Single nu2
) cleotid polymorphisms ,SNPsSNPs 是广泛分布于人类基因组中的稳定多态位点 ,最大程度地代表了个体间的遗传差异. 每组 SNPs 位点所代表的序列称为一个“始祖板块”,每个板块上全部 SNPs 的类型称为单倍型 ( ) Haplotype.
( ) “人类基因组单倍型图谱计划”Haplotype map 属于遗传多态性研究范
畴 ,为人类常见疾病提供简化基因分型 ,致病基因的确定等提供更多的信息.
( )单倍域图谱 Haplotype Block 最初单倍型的概念是一条染色体上不同等位基因的集合 ,而在此单倍型的概念扩展为在一定范围内 SNPs 位点上相应核苷酸碱基的组合. 单倍域的生物学意义更明确 ,单倍域的发现 ,提示人类基因组有着更复杂的结构. 从不同人群中单倍域的差异 ,可以更深入了解生命现象和解释人群间对疾病易感性的差异.
( )人类基因组的单核苷酸多态性 Single nucleotial polymorphisms ,SNPs
遗传信息的变异是所有基因组的共同特征 ,而天然序列的变异是所有基因组的一个基本特征 ,大多数
( ) 人类基因组的多态性是单碱基对的差异 ,也称单核苷酸多态性 Single nucleotide polymorphisms , SNPs是必不可少的重要信息 ,是变异中最常见的一种形式. 核苷酸是基因的组成单元 ,任何两个单倍型人类基因组都表现出多个位点和多种类型的多态性.
( ) 当两个单倍型基因组比较时 ,平均每 1 ,000 个碱基出现一次单碱基差异SNPs. 有关多态性在人类基因组和人群中的类型、频率和分布的基本信息对人类遗传学的进步是极其重要的. 在人类疾病研究中利用这类信息的高通量方法也是需要的.
SNPs 在单个基因或整个基因组中的分布是不均匀的. 基因组中为蛋白质编码的序列为 3 % ,在蛋白质
编码的 SNPs 称为 cSNP ,它和位于表达调控序列中的 SNPs 在功能或致病方面具有更重要的意义. 其多态
( ) 性称为功能多态性 Functional Polymorphism. 自然界之所以没有完全相同的个体 ,就是 SNPs 造成的.
SNPs 位点并不是独立遗传的 ,而是在染色体上成组的遗传 ,即一组 SNPs 位点在一代又一代的遗传中绝少发生重组 . 于是 ,这样的每组 SNPs 位点所代表的序列被称为一个“始祖板块”,每个板块上全部 SNPs 的类型称之为单倍型 ,这里的单倍型是指一条染色体而言. 由于始祖板块在人类进化过程中是保守的 ,故只需少数几个典型的 SNPs 就可以作为该板块内单倍型的标签 ,从而获知一个板块的单倍型.
SNPs 是指在基因水平由单个核苷酸的变异引起的一种 DNA 序列多态性 ,它是人类可遗传的变异中最常见的一种 ,占所有已知多态性的 90 %以上. SNPs 在人类基因中广泛存在.
( ) SNPs 所表现的多态性只涉及到单个碱基的变异 , 这种变异可由单个碱基的转换 Tranrition或颠换
( ) Tranrverzion所引起 ,也可由碱基的插入或缺失所致. 但通常所说 SNPs 是指前者.
在基因组 DNA 中 ,SNPs 可能发生在基因序列内 ,也可能发生在基因以外的非编码序列上. 位于编码
( ) 内的 SNPs coding SNP ,cSNP比较少 ,因为在内显子内 ,其变异率仅及周围序列的 1/ 5 ,但是它在遗传性疾
病的研究中却有重要的意义. 所以 cSNP 的研究更受关注.
) cSNP 可分为 2 种 ,一种是同义 cSNP C synonymoes cSNP即 SNPs 所致编码序列的改变并不影响其所翻
( ) 译的蛋白质的氨基酸序列 ,突变与未突变碱基的含义相同 ; 另一种是非同义 cSNP nonsynonymaus cSNP指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变 ,从而影响了蛋白质的功能 . 这种改变常是导致生物性状改变的直接原因. cSNP 中约有一半为非同义 cSNP.
SNPs 的优点及其应用 :由于 SNPs 在任一特定位点上只有 2 个等位基因 ,因此 ,与简单序列长度多态( ) 性 SSLP相比 ,其所涵盖的信息量很有限 ,似乎很难满足疾病易感基因精确定位的要求. 但这个不足可通过加大分布密度来弥补 ,而且 ,这个目标并不是难以实现的 ,因为完整的 SNPs 图谱完成之后 ,可以提供远高于此要求的密度. 有研究认为 ,1 个核苷酸重复多态性标记的信息量大约是
SNPs 的 2 . 25,2 . 5 倍 . 所用 SNPs 数量虽多 ,但因检测速度快 ,故它将能最终取代 SSLP ,用于复杂性的多基因遗传病研究.
( ) 人类的遗传连锁图谱至今已发展到了第三代. 第一代是限制性酶切片段长度多态性 RFLP图谱 ,第二代是微卫星标记图谱 ,第三代图谱就是 SNPs 图谱.
() SNPs 用作遗传标记具有以下优点 : 1SNPs 在人群中是二等位基因的 ,在任何人群中其等位基因频率
() () 都可估计出来 . 2它在基因组中的分布较微卫星标记广泛得多. 3与串联重复的微卫星位点相比 ,SNPs
( ) 是高度稳定的 ,尤其是处于编码区的 SNP cSNP,而前者的高突变率容易引起对人群的遗传分析出现困
() 难 . 4部分位于基因内部的 SNPs 可能会直接影响产物蛋白质的结构或基因表达水平 ,因此 ,它们本身可
() 能就是疾病遗传机制的候选改变位点 . 5易于进行自动化分析 ,缩短了研究时间.
由于 SNPs 具有以上优点 ,所以其应用范围较微卫星标记更加宽广 ,它对群体遗传学、制药业、法医学、癌症及遗传性疾病甚至进化的研究都将产生不可估量的影响 .
( ( ) 预计今后 SNPs 将在下列领域发挥重要作用 : 1进行简单和复杂疾病的遗传连锁分析 linkage analy2
() ) sis及关联分析 association analysis,用于疾病易感基因定位 : 而且其定位的精度将比微卫星标记精细得
() () 多 ,可直接用于指导易感基因克隆. 2在“药物基因组
学”pharmacogenomics研究中 ,可通过检测 SNPs 的
( ) 遗传多态性标记揭示人群中不同个体对不同药物的敏感性差异的根本原因. 3也可用于法医研究的罪
() 可变区中单个碱基对的改变 ;从上游 V 假基因序列进行序列拷贝的基因转
变 gene conversion和类转变重
( ) 组 CSR - switeh recoubination在同一类序列中进行序列重组产生的抗
体亚型.
研究者在大肠杆菌中表达 AID ,发现细菌对抗抗生素的能力上升了. 就是说基
因突变率增加了 ,突变的倾向是 C - T 和 G - A ,说明 AID 确实具有对脱氧胞
苷的脱氨能力.
高血压的“多基因疾病”研究
人类基因疾病分为单基因疾病和多基因疾病. 多基因疾病所涉及的易感基因数
量多 ,发病原理也更复杂. 对多基因疾病的易感基因的定位和克隆已成为国际上
疾病基因组学研究的重点. 对多基因疾病的易感基因的精确定位 ,只是多基因疾
病的研究的第一步 . 高血压是人类心脑血管疾病中危害最大的一种多基因疾病. 世界各国科学家在竞相寻找引起高血压的易感基因 ,发现人类 2 号染色体 2q 14q 23 区域均
存在高血压的易感基因. 已对定位区段内及其附近的 25 个
高血压候选基因进行了单核苷酸多态性
( ) SNPs的检测 ,以便在缩小的范围内 ,最终找到了高血压的易感基因.
利用基因变异进行挽救生命研究
( ) 在体细胞过渡突变 somatic hypermutation过程中 ,抗体基因以比其它基
因组快 100 万倍速度随机聚集突变的细胞 ,制造出最好的抗体 B 细胞激增 ,当
再次遇到同样病原体时 ,它们会作出最好的有效免疫反应 .
当受到病毒或其他入侵物时 ,人体内一些 B 细胞制造出数百万特殊抗体作为
第一道防线 ,这些 B 细胞穿过淋巴器外膜 ,调节对付入侵者的抗体武器库.
美国两个研究单位的工作均显示 DNA 聚合酶 h 在体细胞过度突变过程中确实发生作用.复杂疾病的 DNA 连锁图
蛋白质的核苷酸密码赋予人们不同的特征 ,也包括个体的疾病倾向性 . 有助
于查明具有心脏病、糖尿病、高血压、精神分裂症、骨质疏松症等及其他复杂疾病倾向性个体的 DNA 差异.
这是由 Rutgers 大学遗传系的计算遗传学实验室将由 SNP 协会提供的数据以创造出包含有 2000 个单
( ) 核苷酸多态性 SNPs相互作用的图谱. SNPs 是许多人共有的 DNA 变异. SNPs 为查明某个疾病相关基因提供捷径 ,容易定位 ,容易将它们作为标记来跟踪基因. 许多 SNPs 位于疾病相关基因中 ,而有些在疾病基因附近.
( )“国际人类单倍型图谱计划”HapMap
( ) HGP“国际单倍型图谱计划”是人类基因组计划的延伸 ,是新一代的人类基因组图谱 ,是“了解人类
() 疾病最重要的基因组计划”DNA. 人类的遗传信息都包含在脱氧核糖核酸
分子上. DNA 是由 4 个不同的碱基以成对的方式组成的 ,或者说以“字母”组合而成的. 人类基因组共有 30 亿对碱基. DNA 碱基一共有 A 、T、G、C 四种 ,这四个字母以一定的顺序排列组合 ,四种碱基的比例关系为 A/ T = G/ C = 1 . HGP 已经基本测出了这 30 亿对“字母”的排列顺序. 不同的个体感染疾病的程度不同、对药物产生的不同反应 ,很可能是由于碱基之间的变异造成的. 找到这些碱基之间的遗传差异 ,以尽快地攻克威胁人类健康的顽疾. 人之间基因组的“字母”排列顺序绝大多数是一致的 ,但也存在着极小差异 ,主要体现在 DNA 个别位置上
( “字母”拼写有所有同 , 这种遗传性变异被称为“单核
苷酸多态性”Single nucleotide polymorphisms ,
) SNPs是人类 DNA 序列的差异. 人类基因组中约有 1000 万个“单核苷酸多态性”,个体对于疾病的不同易
感程度、对药物的不同反应 ,认为是受到“单核苷酸多态性”影响决定的.
人类基因组计划 1990 年 10 月启动 ,目标是破译人类全部遗传信息 ,发现人类所有基因并清楚其位置和功能. 对揭示生命奥秘 ,加深了解疾病本质 ,提高医疗健康水平有极其重要的意义 . 2000 年 6 月人类
基因组草图绘成 ,正式图于 2003 年 4 月完成. 这只是完成基因组稳定的一面 ,未能反映其变异或多态的
一面. “人类基因组单核苷核多态性”的研究正是反映这种多态性 ,而“单倍型图谱计划”则是加速对“人类
基因组单核苷酸多态性”的研究. 单倍型图是人类基因组的遗传整合图 .
识别出人类基因组的所有“单核苷酸多态性”是重要的 ,但是对 SNPs 的研究通过对整个人类基因组的分析来实现 ,其工作量极大 . 实际上 ,在 DNA 上位置比较接近的很多“单核苷酸多态性”,会组成所谓“单倍型块”,每个块大约包含上万个“字母”,并可作为一个整体而遗传 ,通过其中极少数的几个标记“单核苷酸多态性”就可以识别出不同的“单倍型块”. “国际单倍型图谱计划”的目标 ,正是为了绘出人类基因组的“单倍型块”,以及不同“单倍型块”的标记“单核苷酸多态性”. 通过这种方法为寻找人体致病基因提供一条捷径. 由此得到的单倍型图谱 ,将为利用人类基因组图谱寻找与疾病有关的遗传基因的变异 ,即单倍型图谱可更快地确定致病的基因.
“国际遗传变异图谱计划”是于 2002 年 10 月 29 日正式启动 . 自 2000 年 6 月人类基因组草图宣告绘成后 ,人类基因组学领域又有新计划 :由美、
英、中、日、加等国共同参与的“国际遗传变异图谱计划”是一国际性合作. 其正式名为“国际单倍型图谱计划”. 该计划对中国人相对来说更接近 ,将直接选取汉族人的血液样本进行研究. 其宗旨是为了加速识别与癌症和心脏病、糖尿病、哮喘等常见疾病有关的多种致病基
因. “国际单倍型图谱计划”是将人类基因组成果真正应用于医疗实际工作方面迈出的关键一步.
“国际单倍型图谱计划”预计将于 3 年内完成. 计划从美国、亚洲和非洲采集血液样本 ,从中提取 DNA () 脱氧核糖核酸进行分析 ,研究工作的过程将在确保调查对象完全知情同意下进行 .
人类基因组的序列图只反映了基因组稳定的一面 ,并未反映其变异多态的一
面 ,而正是这种基因组的多态性 ,即序列排列的差异构成的个体与群体的差异形成了对疾病的不同易感性、对药物及环境等因素的不同反映的遗传学基础. 人类基因组中的多态性 ,最简单最多见的形式就是发生在基因组中的单个核苷酸 ,即SNPs ,可以认为是 DNA 序列的差异 ,SNPs 是重要的遗传标志之一 ,可以认为SNPs 确实可使人易患病 ,或影响其对药物的敏感性 ,DNA 序列变化对生命、对疾病、环境攻击和对疾病治疗反应产生重大影响. 而单倍型图谱则是快速研究SNPs 的有效途径 ,在 HGP 已进入绘制更精确的完成图阶段 ,新启动的“国际单倍型图谱计划”既是利用了人类基因组计划的成果 ,又是对其补充和发展.
相关资料
“人类基因组单倍型图计划”的主要任务
() 对于人类的所有生命活动 ,基因是最基本的. 基因是由脱氧核糖核酸 DNA 构成. 人类的 99 . 9 %的 DNA 都是相同的 ,但没有两个人的 DNA 完全一致 ,除非是同卵双生子. 不同个体的 DNA 之间的差异称为遗传多态性. 这些信息解释了个人之间的一些区别 ,例如眼睛的颜色和血型. 同时 ,遗传多态性还部分解释了
为什么有些人会患上诸如癌症、糖尿病、哮喘和抑郁症之类的疾病 ,而另一些人却不会 . 但是 ,饮食、体育锻炼、吸烟、有害物质和其他因素也会影响疾病的产生 ,这些使研究人员目前很难判断哪个基因是致
病的.
研究人员将通过收集来的样本 ,寻找遗传变异的常见模式 . 通过对这些常见模式的研究 ,研究人员希望找到与疾病有关的基因 . 在了解这些基因是如何导致疾病之后 ,研究人员就能设计出更好的预防、诊断
和治疗疾病的方法 ,同时还可研发出适于更多人的、疗效更好的药物.
析 ,又准确了解人类起源、进化和迁徙过程中的 DNA 序列变化 ,人类起源进化迁徙历史的研究等提供完整
的人类基因组信息和有效的研究工具.
单倍型图的绘制 ,将为不同群体的遗传多态性研究、疾病和遗传关联分析、致病基因和致病因子的确定、药效及副作用和疾病风险的分析、人类起源进化迁徙历史的研究等提供完整的人类基因组信息和有效
的研究工具. 可以说 ,只有在单倍型图建立后 ,人类基因组的遗传图、物理图、转录图和序列图对于医学的
意义才能完全体现.
这一计划的目的是在完成人类基因组序列测定 ,即了解人类遗传变异的基本信息之后 ,进一步确立世界上主要人群基因组的常见 DNA 变异.“人类基因组单倍型图计划”属于遗传多态性研究范畴. 为人类常见疾病提供简化有关基因分型 ,使基因组分型更全面、准确和精细为人类不同群体的遗传多态性研究 ,致病基因的确定等提供更多的信息.
只有在单倍型图谱建立后 ,人类基因组的遗传图、物理图、转录图和序列图对于生物医学的意义才能完全实现.
单倍域图谱
在后基因组时代 ,功能基因组研究成为关注热点. 功能基因组研究是建立在基因组多样性的基础上
( ) 的 ,在以 SNPs 为重点的多样性研究、绘制人类基因组单倍型图谱haplotype map 过程中 ,又提出了单倍域的新概念 ,单倍域图谱有可能取代最初绘制单倍型图谱的计划.
SNPs 和 Haplotype
虽然利用 SNPs 信息寻找疾病基因 ,科学家发现 SNPs 变化数量之大 ,但是在染色体某些片断上 ,它们却仅仅只有少数几种组合方式 ,这些不同的组合方式即是 SNPs 单倍型 ,最初单倍型的意义是一条染色体上 ,不同的等位基因的集合 ,而在这里单倍型概念扩展为在一定范围内 SNPs 位点上相应核苷酸碱基的组合 .
单个 SNP 与疾病无相关性 ,而几个 SNPs 的集合———单倍型与疾病有良好的相关性. 但是 SNPs 的单倍型仍各有其运用范围 , 主要取决于 contributing SNP 是否被检测到 , 被检测区域的 LD 跨度有多长. 当 Causative SNP 数目小于单倍型数目时 ,基于 SNPs 的分析更为有效 ,而单倍型数目在 4 - 5 或以下时 ,则基于
单倍型的分析是有效的. 在大多数情况下 ,SNPs 的集合即单倍型的分析是更
为有力的 .
单倍型和单倍域
( 研究发现 ,染色体上存在着连续、稳定的几乎没有被重组所打断的单倍型
范围 ,称之为单倍域 Haplo2
) type Block,单倍域很可能是遗传的最小单位 ,在极端情况下 ,它可以是一
个单独的 SNP ,或者是一整条染色体 ,事实上往往其中很少的一部分单倍型就可以包括大部分的基因状态 ,在分型时可省节大量工作量 ,
而对延续范围更广的单倍域则节省更多工作量.
两个相邻单倍域的交界位置 ,称为单倍域的断点 ,断点是否与“重组热点”存在密切关系 ? 找到相应证据 ,则单倍域的生物学意义更明确.
单倍域的发现 ,提示人类基因组中有着高度的复杂结构 ,绝非单纯的碱基变异的组合与任意的组合 . 单倍域的确定存在 ,就可以找到相当部分的统一的单倍域结构 ,不同人群中的单倍域的差异 ,不仅可以解释其自身独特的历史迁徙情况 ,也可以解释人群间某些疾病易感性的差异.
部分资料摘自 < Bio - info China > < Biosino >。

相关文档
最新文档