第十一章 基因组与比较基因组学
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十一章 基因组与比较基因组学
20世纪人类科技发展史上的三大创举
90年代人类基因组计划
60年代人类首次登上月球 40年代第一颗原子弹爆炸
• 基因组学是美国人T〃H〃Rodehck在1986年7月造 出来的。 • 基因组是生物体内遗传信息的集合,是某个特定 物种细胞内全部DNA分子的总和(细胞内细胞器 的DNA属于该细胞器的基因组)。
一、高通量DNA分析技术
1. DNA序列测定的基本原理 • 无论是对于重组质粒、单个基因还是整个基 因组,分析DNA结构的最基本方法就是测定 出这些DNA分子的一级结构——DNA序列。
• DNA自动测序仪可快速测定DNA序列,计算机 处理能力的快速提高则使得大量DNA小片段 很容易拼接成较大的片段甚至整个染色体。
• ‚遗传图‛的建立为人类疾病相关基因的分 离克隆奠定了基础。拥有5000多个遗传学位 点,相当于把整个人类基因组划分为5000多 个小区,并分别设臵了‚标牌‛。如果在家 系中证实该基因与某个标记不连锁(重组率 为50%),表明该基因不在这一标记附近。
Leabharlann Baidu
• 如果发现该基因与某个标记有一定程度的‚ 连锁‛(重组率小于50%但大于0),表明它 可能位于这个标记附近。 • 如果该基因与某标记间不发生重组(重组率 等于0),我们就推测该标记与所研究的疾 病基因可能非常接近。
–原核生物基因组:原核生物DNA分布在整个细 胞之中,有时相对集中在类核体上。类核体上 的DNA是一条共价、闭合双链分子,类核体通 常也称为染色体。这条染色体的DNA就是原核 细胞的基因组。 –真核生物基因组:一个物种的单倍体的各条 染 色 体 中 的 全 部 DNA 为 该 物 种 的 基 因 组 ( genome)。例如,人有23对染色体,配子—— 单倍体是23条染色体,这23条染色体中的全部 DNA就是人体基因组。
鸟枪法基因组序列分析技术
• DNA序列分析技术一次测序反应的长度不能 超过1kb,不能直接用BAC等大片段作为序列 分析的模板,采用全基因组鸟枪法测序技术 ——随机挑选插入基因组DNA的质粒做测序 反应,然后用计算机程序进行序列拼接。
• 采用全基因组鸟枪法测序的基本原理:
• 对某基因组文库全部克隆片段进行末端序列测定中 未测到的碱基数,即缺口(gap),与已测定的总碱 基数相关。
• 整个人类基因组中,有1%-5%的序 列编码了蛋白质,最多可能有( 5~7)万个蛋白质编码基因。得到 了一段cDNA或一个EST,就能被用 于筛选全长的转录本,并将该基 因准确地定位于基因组上。 • cDNA序列具有转录本的特异性, 代表了不同基因的信息。可以将 DNA序列和cDNA序列进行比对,找 出对应于cDNA的基因。
1. 人类基因组计划的科学意义
• 确定人类基因组中约3-4万个编 码基因的序列及其在基因组中的 物理位臵,研究基因的产物及其 功能。 • 了解转录和剪接调控元件的结构 与位臵,从整个基因组结构的宏 观水平上理解基因转录与转录后 调节。
• 从整体上了解染色体结构,了解各种不 同序列在形成染色体结构、DNA复制、基 因转录及表达调控中的影响与作用。
• 第二代DNA遗传标记
• STRP的优点是‚多态性‛与‚高频率‛。 由于(A)n,(CA)n,(CGG)n等短重复序列在 进化上不受选择,在同一位点上可重复单位 数量变化很大,配对时又容易产生‚错配‛ ,使这样的位点遍布于整个基因组。 • 已有5264个STRP为主体的遗传标记‚连锁 图‛,平均分辨率已达600kb,其中第17号 染色体上平均每495 kb有一个标记,第9号 染色体上平均每767 kb有一个标记,整个 基因组中只有三处标记间距大于4Mb。
• 收集各种细胞或组织的基因表达谱进行两两或 多重比较,能较全面地了解哪些基因是特异性 表达的。在某一细胞或组织中特异性表达的基 因可能与该组织或细胞类型的生理功能有关。 • 获得各类组织或细胞的基因表达谱,从而给出 人体200余种基本组织或不同细胞组成的人体 基因图(bodymap)。 • 转录图(基因表达谱)研究所提供的信息,使 人们有可能系统地全面地从mRNA水平了解特定 细胞、组织或器官的基因表达模式并解释其生 理属性,深入认识细胞生长、发育、分化、衰 老和疾病发生的机制。
• 以人类基因组和拟南芥基因组为例说明你对生
物基因组全序测定工作的科学意义与社会意义
的认识(8分)
中国科学院2002年 硕士学位研究生入学分子遗传学试题
2. 遗传图
• 遗传图又称连锁图(Linkage Map),是指基因或DNA标志在 染色体上的相对位臵与遗传距 离,通常以基因或DNA片段在 染色体交换过程中的分离频率 厘摩(cM)来表示。cM值越大 ,两者之间距离越远。
得到 5套以上 包含相 关染色 体或整个基因组 的 DNA片段是建立STS物理图的先决条件。然后, 可以通过拼接而得STS物理图。两个STS标签在 基因组上靠得近,它们就会一直同时出现在DNA 大片段上几率就会小得多。
酵母第三号染色体遗传图 (右)和物理图(左)的比较
4. 转录图
• 人类的基因转录图(cDNA图), 或者基因的cDNA片段图,即表达 序 列 标 签 图 ( EST , expressed sequence tag)是人类基因组图 的雏型。 • 在成年个体的每一特定组织中, 一般只有10%~20%的结构基因(约 1~2万个不同类型的mRNA)表达。
• 第三代DNA遗传标记,可能也是最好的遗传标 记,是分散于基因组中的单个碱基的差异, 即单核苷酸的多态性(SNP),包括单个碱基 的缺失、插入和替换。 • SNP中大多数为转换,即由一种嘧啶碱基替换 另一种嘧啶碱基,或由一种嘌呤碱基替换另 一种嘌呤碱基,颠换与转换之比为1:2。
• SNP有可能在密度上达到人类基因组‚多态‛ 位点数目的极限。估计人类基因组中可能有 300万个SNP位点! • SNP与RFLP和STRP标记的主要不同之处在于, 它不再以DNA片段的长度变化作为检测手段, 而直接以序列变异作为标记。
• 随着已测定碱基数的增加,缺口的总 碱基数目会按照泊松公式的一个推论 (P=e-m )迅速减小。其中P为基因组 中某个碱基未被测定的概率,m为所 测定的碱基数与基因组大小相比的倍 数。m越大P值越小。当m=5(即随机 测定的碱基数达到基因组5倍),基 因组中未测定的碱基数为总碱基数的 0.67%(e-5=0.0067)。 对流感嗜血 杆菌基因组(1.83Mb)来说,可能留 有128个平均长为100bp的缺口。
• 高效快捷的DNA测序方法是20世 纪70年代中期发展起来的,主要 有两种:Sanger的双脱氧链终止 法 和 Maxam-Gilbert 的 化 学 修 饰 法。前者因更适应序列分析的自 动化而逐渐占据优势。
• Sanger 的双脱氧链终止法
• 基本原理:
• 核酸模板在核酸聚合酶、引物、 四种单脱氧碱基存在条件下复制 或转录时,如果在四管反应系统 中分别按比例引入四种双脱氧碱 基,只要双脱氧碱基掺入链端, 该链就停止延长,链端掺入单脱 氧碱基的片段可继续延长。
3. 物理图
• 人类基因组的物理图是指以已知核 苷酸序列的DNA片段(序列标签位 点, STS)为‚路标‛,以碱基对 (bp,kb,Mb)作为基本测量单位 (图距)的基因组图。 • STS是基因组中任何单拷贝的长度 在100~500bp之间的DNA序列,与 核酸内切酶识别序列相关联。 • 物理图主要内容是建立相互重叠连 接的‚相连DNA片段群‛。
如此每管反应体系中便合成以 共同引物为5’端,以双脱氧碱 基为3’端的一系列长度不等的 核酸片段。反应终止后,分四 个泳道进行电泳,以分离长短 不一的核酸片段(长度相邻者 仅差一个碱基),根据片段3’ 端的双脱氧碱基,便可依次阅 读合成片段的碱基排列顺序。
基因组DNA大片段文库的构建
• 构建基因文库是测序前必须的预备 工作。用细菌的F质粒及其调控基 因构建了细菌染色体克隆载体BAC ,其克隆能力在125- 150kb左右。 以BAC为基础的克隆载体转化效率 高,而且以环状结构存在于细菌体 内,易于分辨和分离纯化。
• 对鸟枪法的改进:
• Clone contig法。首先用稀有内切酶把待测基因组
降解为数百kb以上的片段,再分别测序。
• 靶标鸟枪法(direted shotgun)。首先根据染色体
上已知基因和标记的位臵来确定部分DNA片段的相
对位臵,再逐步缩小各片段之间的缺口。
改进后的鸟枪测序法原理图
二、 人类基因组计划
二000年六月二十六日克林顿宣布 人类基因组草图绘制完成
美国国家人类基因组研究所所长弗朗西斯〃柯林 斯在介绍情况。
人类基因组草图基本信息
人类基因组
• 由31.65亿bp组成 • 含3~3.5万基因
人类蛋白质
• 61%与果蝇同源
• 43%与线虫同源
• 与蛋白质合成有关 • 46%与酵母同源
的基因占2%
卫星DNA分类
特征
卫星DNA
α卫星DNA
串联重复的基本单位首尾相接,在基因组中呈不均匀分布,但主要集 中于着丝粒、端粒等特定部位,高度或中等重复,分属三个大家族。
中等重复,基本单位长171bp。
小卫星DNA
微卫星DNA
中等重复,基本单位长15~65bp。
中等重复,基本单位长2~8bp
• 第二代DNA遗传标记利用了存在于人类基因组中的 大量重复序列: –重复单位长度在15-65个核苷酸左右的小卫星 DNA; –重复单位长度在2-6个核苷酸之间的微卫星DNA ,又称为简短串联重复(STR、STRP或SSLP)。
第三,序列集合。TIGR 发展了新的软件,修改了 序列集合规则以最大限度 地排除错误的连锁匹配。 第四,填补缺口。有两 种待填补的缺口,一是没 有相应模板DNA的物理缺口 ,二是有模板DNA但未测序 的序列缺口。他们建立了 插入片段为15-20kb的λ文 库以备缺口填补。
• 鸟枪法测序的缺点: 随着所测基因组总量 增大,所需测序的片段大量增加,各个片段 重叠成一个连续体的概率是2n2-2n 。
• 产生配子的减数分裂过程中,亲代 同‚号‛的父源或母源染色体既能 相互配对也可能发生片段互换,而 父母源染色体等位基因互换导致子 代出现DNA‚重组‛的频率与这两个 位点之间的距离呈正相关,所以, 用两个位点之间的交换或重组频率 来表示其‚遗传学距离‛。
• 连锁分析是通过分析同一遗传位点 在不同个体中等位基因的不同(多 态性)来研究同一染色体上两位点 之间的相互关系
• 2003年4月14日,国际人类基因组宣布: 人类基因组序列图--‚完成图‛提前绘 制成功。 • 人类基因组包括24条染色体,约30亿对 核苷酸,编码5万~6万个基因,人类基 因组中携带了有关人类个体生长发育、 生老病死的全部遗传信息。 • 从整体上看,不同人类个体的基因是相 同的,因此,我们说‚人类只有一个基 因组‛,人生来是平等的。当然,不同 的人可能拥有不同的等位基因,这一点 决定了人与人之间个体上的差异。
• 研究空间结构对基因调节的作用。
• 发现与DNA复制、重组 • 研究DNA突变、重排和染色体断裂等,了解 疾病的分子机制,为疾病诊断、预防和治疗 提供理论依据。
• 确定人类基因组中转座子、逆转座子和病毒 残余序列,研究其周围序列的性质。等有关 的序列。 • 研究人类个体之间的多态性(SNP)情况, 用于基因诊断、个体识别、亲子鉴定、组织 配型、发育进化等许多医疗、司法和人类学 的研究。
• 遗传距
离图的
基本数
据来自
基因的
重组。
注:上述4个基因都位于果蝇的X染色体上
• 由于不能对人类进行‚选择性‛婚配, 而且人类子代个体数量有限、世代寿命 较长,呈共显多态性的蛋白质数量不多 ,等位基因的数量不多。DNA技术的建立 为人类提供了大量新的遗传标记。遗传 标记有三代:
• 第一代DNA遗传标记是RFLP(限制性片 段长度多态性)。DNA序列上的微小变 化,甚至1个核苷酸的变化,也能引起 限制性内切酶切点的丢失或产生,导致 酶切片段长度的变化
• 全基因组鸟枪法测序的主要步骤 是: 第一,建立高度随机、插入 片段大小为2kb左右的基因组文 库。克隆数要达到一定数量,即 经末端测序的克隆片段的碱基总 数应达到基因组5倍以上。 第二,高效、大规模的末端 测序。对文库中每一个克隆,进 行两端测序,TIGR在完成流感嗜 血杆菌的基因组时,使用了14台 测序仪,用三个月时间完成了必 需的28,463个测序反应,测序总 长度达6倍基因组。
20世纪人类科技发展史上的三大创举
90年代人类基因组计划
60年代人类首次登上月球 40年代第一颗原子弹爆炸
• 基因组学是美国人T〃H〃Rodehck在1986年7月造 出来的。 • 基因组是生物体内遗传信息的集合,是某个特定 物种细胞内全部DNA分子的总和(细胞内细胞器 的DNA属于该细胞器的基因组)。
一、高通量DNA分析技术
1. DNA序列测定的基本原理 • 无论是对于重组质粒、单个基因还是整个基 因组,分析DNA结构的最基本方法就是测定 出这些DNA分子的一级结构——DNA序列。
• DNA自动测序仪可快速测定DNA序列,计算机 处理能力的快速提高则使得大量DNA小片段 很容易拼接成较大的片段甚至整个染色体。
• ‚遗传图‛的建立为人类疾病相关基因的分 离克隆奠定了基础。拥有5000多个遗传学位 点,相当于把整个人类基因组划分为5000多 个小区,并分别设臵了‚标牌‛。如果在家 系中证实该基因与某个标记不连锁(重组率 为50%),表明该基因不在这一标记附近。
Leabharlann Baidu
• 如果发现该基因与某个标记有一定程度的‚ 连锁‛(重组率小于50%但大于0),表明它 可能位于这个标记附近。 • 如果该基因与某标记间不发生重组(重组率 等于0),我们就推测该标记与所研究的疾 病基因可能非常接近。
–原核生物基因组:原核生物DNA分布在整个细 胞之中,有时相对集中在类核体上。类核体上 的DNA是一条共价、闭合双链分子,类核体通 常也称为染色体。这条染色体的DNA就是原核 细胞的基因组。 –真核生物基因组:一个物种的单倍体的各条 染 色 体 中 的 全 部 DNA 为 该 物 种 的 基 因 组 ( genome)。例如,人有23对染色体,配子—— 单倍体是23条染色体,这23条染色体中的全部 DNA就是人体基因组。
鸟枪法基因组序列分析技术
• DNA序列分析技术一次测序反应的长度不能 超过1kb,不能直接用BAC等大片段作为序列 分析的模板,采用全基因组鸟枪法测序技术 ——随机挑选插入基因组DNA的质粒做测序 反应,然后用计算机程序进行序列拼接。
• 采用全基因组鸟枪法测序的基本原理:
• 对某基因组文库全部克隆片段进行末端序列测定中 未测到的碱基数,即缺口(gap),与已测定的总碱 基数相关。
• 整个人类基因组中,有1%-5%的序 列编码了蛋白质,最多可能有( 5~7)万个蛋白质编码基因。得到 了一段cDNA或一个EST,就能被用 于筛选全长的转录本,并将该基 因准确地定位于基因组上。 • cDNA序列具有转录本的特异性, 代表了不同基因的信息。可以将 DNA序列和cDNA序列进行比对,找 出对应于cDNA的基因。
1. 人类基因组计划的科学意义
• 确定人类基因组中约3-4万个编 码基因的序列及其在基因组中的 物理位臵,研究基因的产物及其 功能。 • 了解转录和剪接调控元件的结构 与位臵,从整个基因组结构的宏 观水平上理解基因转录与转录后 调节。
• 从整体上了解染色体结构,了解各种不 同序列在形成染色体结构、DNA复制、基 因转录及表达调控中的影响与作用。
• 第二代DNA遗传标记
• STRP的优点是‚多态性‛与‚高频率‛。 由于(A)n,(CA)n,(CGG)n等短重复序列在 进化上不受选择,在同一位点上可重复单位 数量变化很大,配对时又容易产生‚错配‛ ,使这样的位点遍布于整个基因组。 • 已有5264个STRP为主体的遗传标记‚连锁 图‛,平均分辨率已达600kb,其中第17号 染色体上平均每495 kb有一个标记,第9号 染色体上平均每767 kb有一个标记,整个 基因组中只有三处标记间距大于4Mb。
• 收集各种细胞或组织的基因表达谱进行两两或 多重比较,能较全面地了解哪些基因是特异性 表达的。在某一细胞或组织中特异性表达的基 因可能与该组织或细胞类型的生理功能有关。 • 获得各类组织或细胞的基因表达谱,从而给出 人体200余种基本组织或不同细胞组成的人体 基因图(bodymap)。 • 转录图(基因表达谱)研究所提供的信息,使 人们有可能系统地全面地从mRNA水平了解特定 细胞、组织或器官的基因表达模式并解释其生 理属性,深入认识细胞生长、发育、分化、衰 老和疾病发生的机制。
• 以人类基因组和拟南芥基因组为例说明你对生
物基因组全序测定工作的科学意义与社会意义
的认识(8分)
中国科学院2002年 硕士学位研究生入学分子遗传学试题
2. 遗传图
• 遗传图又称连锁图(Linkage Map),是指基因或DNA标志在 染色体上的相对位臵与遗传距 离,通常以基因或DNA片段在 染色体交换过程中的分离频率 厘摩(cM)来表示。cM值越大 ,两者之间距离越远。
得到 5套以上 包含相 关染色 体或整个基因组 的 DNA片段是建立STS物理图的先决条件。然后, 可以通过拼接而得STS物理图。两个STS标签在 基因组上靠得近,它们就会一直同时出现在DNA 大片段上几率就会小得多。
酵母第三号染色体遗传图 (右)和物理图(左)的比较
4. 转录图
• 人类的基因转录图(cDNA图), 或者基因的cDNA片段图,即表达 序 列 标 签 图 ( EST , expressed sequence tag)是人类基因组图 的雏型。 • 在成年个体的每一特定组织中, 一般只有10%~20%的结构基因(约 1~2万个不同类型的mRNA)表达。
• 第三代DNA遗传标记,可能也是最好的遗传标 记,是分散于基因组中的单个碱基的差异, 即单核苷酸的多态性(SNP),包括单个碱基 的缺失、插入和替换。 • SNP中大多数为转换,即由一种嘧啶碱基替换 另一种嘧啶碱基,或由一种嘌呤碱基替换另 一种嘌呤碱基,颠换与转换之比为1:2。
• SNP有可能在密度上达到人类基因组‚多态‛ 位点数目的极限。估计人类基因组中可能有 300万个SNP位点! • SNP与RFLP和STRP标记的主要不同之处在于, 它不再以DNA片段的长度变化作为检测手段, 而直接以序列变异作为标记。
• 随着已测定碱基数的增加,缺口的总 碱基数目会按照泊松公式的一个推论 (P=e-m )迅速减小。其中P为基因组 中某个碱基未被测定的概率,m为所 测定的碱基数与基因组大小相比的倍 数。m越大P值越小。当m=5(即随机 测定的碱基数达到基因组5倍),基 因组中未测定的碱基数为总碱基数的 0.67%(e-5=0.0067)。 对流感嗜血 杆菌基因组(1.83Mb)来说,可能留 有128个平均长为100bp的缺口。
• 高效快捷的DNA测序方法是20世 纪70年代中期发展起来的,主要 有两种:Sanger的双脱氧链终止 法 和 Maxam-Gilbert 的 化 学 修 饰 法。前者因更适应序列分析的自 动化而逐渐占据优势。
• Sanger 的双脱氧链终止法
• 基本原理:
• 核酸模板在核酸聚合酶、引物、 四种单脱氧碱基存在条件下复制 或转录时,如果在四管反应系统 中分别按比例引入四种双脱氧碱 基,只要双脱氧碱基掺入链端, 该链就停止延长,链端掺入单脱 氧碱基的片段可继续延长。
3. 物理图
• 人类基因组的物理图是指以已知核 苷酸序列的DNA片段(序列标签位 点, STS)为‚路标‛,以碱基对 (bp,kb,Mb)作为基本测量单位 (图距)的基因组图。 • STS是基因组中任何单拷贝的长度 在100~500bp之间的DNA序列,与 核酸内切酶识别序列相关联。 • 物理图主要内容是建立相互重叠连 接的‚相连DNA片段群‛。
如此每管反应体系中便合成以 共同引物为5’端,以双脱氧碱 基为3’端的一系列长度不等的 核酸片段。反应终止后,分四 个泳道进行电泳,以分离长短 不一的核酸片段(长度相邻者 仅差一个碱基),根据片段3’ 端的双脱氧碱基,便可依次阅 读合成片段的碱基排列顺序。
基因组DNA大片段文库的构建
• 构建基因文库是测序前必须的预备 工作。用细菌的F质粒及其调控基 因构建了细菌染色体克隆载体BAC ,其克隆能力在125- 150kb左右。 以BAC为基础的克隆载体转化效率 高,而且以环状结构存在于细菌体 内,易于分辨和分离纯化。
• 对鸟枪法的改进:
• Clone contig法。首先用稀有内切酶把待测基因组
降解为数百kb以上的片段,再分别测序。
• 靶标鸟枪法(direted shotgun)。首先根据染色体
上已知基因和标记的位臵来确定部分DNA片段的相
对位臵,再逐步缩小各片段之间的缺口。
改进后的鸟枪测序法原理图
二、 人类基因组计划
二000年六月二十六日克林顿宣布 人类基因组草图绘制完成
美国国家人类基因组研究所所长弗朗西斯〃柯林 斯在介绍情况。
人类基因组草图基本信息
人类基因组
• 由31.65亿bp组成 • 含3~3.5万基因
人类蛋白质
• 61%与果蝇同源
• 43%与线虫同源
• 与蛋白质合成有关 • 46%与酵母同源
的基因占2%
卫星DNA分类
特征
卫星DNA
α卫星DNA
串联重复的基本单位首尾相接,在基因组中呈不均匀分布,但主要集 中于着丝粒、端粒等特定部位,高度或中等重复,分属三个大家族。
中等重复,基本单位长171bp。
小卫星DNA
微卫星DNA
中等重复,基本单位长15~65bp。
中等重复,基本单位长2~8bp
• 第二代DNA遗传标记利用了存在于人类基因组中的 大量重复序列: –重复单位长度在15-65个核苷酸左右的小卫星 DNA; –重复单位长度在2-6个核苷酸之间的微卫星DNA ,又称为简短串联重复(STR、STRP或SSLP)。
第三,序列集合。TIGR 发展了新的软件,修改了 序列集合规则以最大限度 地排除错误的连锁匹配。 第四,填补缺口。有两 种待填补的缺口,一是没 有相应模板DNA的物理缺口 ,二是有模板DNA但未测序 的序列缺口。他们建立了 插入片段为15-20kb的λ文 库以备缺口填补。
• 鸟枪法测序的缺点: 随着所测基因组总量 增大,所需测序的片段大量增加,各个片段 重叠成一个连续体的概率是2n2-2n 。
• 产生配子的减数分裂过程中,亲代 同‚号‛的父源或母源染色体既能 相互配对也可能发生片段互换,而 父母源染色体等位基因互换导致子 代出现DNA‚重组‛的频率与这两个 位点之间的距离呈正相关,所以, 用两个位点之间的交换或重组频率 来表示其‚遗传学距离‛。
• 连锁分析是通过分析同一遗传位点 在不同个体中等位基因的不同(多 态性)来研究同一染色体上两位点 之间的相互关系
• 2003年4月14日,国际人类基因组宣布: 人类基因组序列图--‚完成图‛提前绘 制成功。 • 人类基因组包括24条染色体,约30亿对 核苷酸,编码5万~6万个基因,人类基 因组中携带了有关人类个体生长发育、 生老病死的全部遗传信息。 • 从整体上看,不同人类个体的基因是相 同的,因此,我们说‚人类只有一个基 因组‛,人生来是平等的。当然,不同 的人可能拥有不同的等位基因,这一点 决定了人与人之间个体上的差异。
• 研究空间结构对基因调节的作用。
• 发现与DNA复制、重组 • 研究DNA突变、重排和染色体断裂等,了解 疾病的分子机制,为疾病诊断、预防和治疗 提供理论依据。
• 确定人类基因组中转座子、逆转座子和病毒 残余序列,研究其周围序列的性质。等有关 的序列。 • 研究人类个体之间的多态性(SNP)情况, 用于基因诊断、个体识别、亲子鉴定、组织 配型、发育进化等许多医疗、司法和人类学 的研究。
• 遗传距
离图的
基本数
据来自
基因的
重组。
注:上述4个基因都位于果蝇的X染色体上
• 由于不能对人类进行‚选择性‛婚配, 而且人类子代个体数量有限、世代寿命 较长,呈共显多态性的蛋白质数量不多 ,等位基因的数量不多。DNA技术的建立 为人类提供了大量新的遗传标记。遗传 标记有三代:
• 第一代DNA遗传标记是RFLP(限制性片 段长度多态性)。DNA序列上的微小变 化,甚至1个核苷酸的变化,也能引起 限制性内切酶切点的丢失或产生,导致 酶切片段长度的变化
• 全基因组鸟枪法测序的主要步骤 是: 第一,建立高度随机、插入 片段大小为2kb左右的基因组文 库。克隆数要达到一定数量,即 经末端测序的克隆片段的碱基总 数应达到基因组5倍以上。 第二,高效、大规模的末端 测序。对文库中每一个克隆,进 行两端测序,TIGR在完成流感嗜 血杆菌的基因组时,使用了14台 测序仪,用三个月时间完成了必 需的28,463个测序反应,测序总 长度达6倍基因组。