基因与基因组(2学时)-2014
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 真核生物基因组中的DNA重复序列主要有哪些类 型?简要说明基因组重复序列可能的生物学意 义以及基因组重复序列在分子标记研究中的应 用 (12分)
中国科学院2002年
硕士学位研究生入学分子遗传学试题
第三代多态性标记是单核苷酸的多态性 (single nucleotide polymorphism,SNP)
2000.6. 完成并公布人类基因组工作框 架图( 90%)。
二000年六月二十六日克林顿宣布 人类基因组草图绘制完成
2000年6月公共领域测序计划工作框架图
美国国家人类基因组研究所所长弗朗西斯· 柯林 斯在介绍情况。
人类基因组草图基本信息
人类基因组
• 由31.65亿bp组成 • 含3~3.5万基因
及表达调控中的影响与作用。
(4)研究空间结构对基因调节的作用。有些基因的 表达调控序列与被调节基因从直线距离上看,似乎 相距甚远,但若从整个染色体的空间结构上看则恰 恰处于最佳的调节位置,因此,有必要从三维空间
的角度来研究真核基因的表达调控规律。
(5)发现与DNA复制、重组等有关的序列。DNA的
忠实复制保障了遗传的稳定性,正常的重组提供
人类基因组的特征
• 20000~25000 个蛋白编码基因 • 许多特征(基因、转座子、GC含量、CpG岛和重组 率等)在基因组上分布不均 • 大部分转座子活性明显下降 • 染色体末端重组率较高,着丝粒附近较低,越短 的染色体重组率越高,重组率在不同性别之间有 差别 • 含大量SNP
三、人类基因组计划的科学意义
复序列拷贝数的变化
小卫星DNA—由15-65bp的基本单位串联重复而成,
长度一般不超过20kb。 重复次数(小卫星DNA区的长度)在人群中是高度变 异的;按照孟德尔的规律遗传 微卫星DNA/简短串联重复(STR、STRP或SSLP) 重复单元2-8bp,通常重复10-60次
CTAGCTTATATATATATATATATATATATAAGCTTGC
由亲代传给子代,从而在不同个体间表现出不同,
因而被称为多态性(Polymorphism)。
第一代多态性标记是RFLP(restriction fragment
length polymorphism,限制性片段长度多态性)
第二代多态性标记是短的串联重复序列 包括小卫星DNA和微卫星DNA,其多态性主要来自重
Sequence Gap
三、DNA的鸟枪法测序的优缺点
优点:速度快
缺点:
●随着所测基因组总量增大,所需测序的片段大量
增加
●高等真核生物(如人类)基因组中有大量重复序
列,导致判断失误
基因图(gene map)
即在序列图基础上,用不同的方法测 定各个基因所在区域位置。 基因图测定方法: 1.CpG岛的应用:大多数持家基因和40% 组织特异性基因5’端均存在CpG岛序列。制备 探针,染色体涂染指示基因位置分布。
G A T C C T A G G G A T C C C C T A G G
5’ BamHⅠ 3’
PstⅠ
G G A T C C C C T A G G C T G C A G G A C G T C
5’ 3’
C T G C A G G A C G T C
限制性内切核酸酶
限制酶:能够识别 DNA链的特定部位 并能进行切割。
了变异与进化的分子基础。局部DNA的推迟复制、
异常重组等现象则导致疾病或者胚胎不能正常发
育,因此,了解与人类DNA正常复制和重组有关
的序列及其变化,将对研究人类基因组的遗传与
进化提供重要的结构上的依据。
再用超级计算机组装成重叠线。所形成的序
列图称celera序列。
…………… ACGTCCGATCGGTTCATGCC
TCGGTTCATGCCAATGCCGTCC…………
第二节 DNA的鸟枪法序列分析技术
一、DNA的鸟枪法测序原理
1999 年 12 月用“逐个克隆 法”获得第一条 人类染色体 —22 号染色体完成序 列
EcoRⅠ
菌株名 种名 属名
酶的序号
限制性内切核酸酶
HaeⅢ
5’ 3’ 5’ 3’
G G C C C C G G
G A T C C T A G
3’ 5’ 3’ 5’ 3’ 5’ 3’ 5’
5’ 3’
5’ 3’ 5’ 3’ 5’ 3’
G G C C
C C G G
3’ 5’
3’ 5’ 3’ 5’ 3’ 5’
占计划的 6%。 (2)完成一系列模式生物全基因组测定。 这些模式生物全基因组测定的完成有重大 理论与现实意义。
(3)DNA 测序技术飞速提高
1998.5.9. J.C. Venter 等宣布,组建商业公
司,投入 3 亿美元,3 年内完成。 接着又有若干家公司成立,总共投入资金约 几十亿美元,形成“公”“私”并进格局。
(1)确定人类基因组中约5万个编码基因的序列 及其在基因组中的物理位置,研究基因的产物
及其功能。
(2)了解转录和剪接调控元件的结构与位置,
从整个基因组结构的宏观水平上理解基因转录
与转录后调节。
(3)从整体上了解染色体结构,包括各种重复序列
以及非转录“框架序列”的大小和组织,了解各种
不同序列在形成染色体结构、DNA复制、基因转录
人类基因组计划研究的主要成果和进展表现在这副图上
• 遗传图谱 又称为连锁图谱(linkage map), 指基因或DNA标志在染色体上的相 对位置与遗传距离 ( 1厘摩(cM) =减数分裂时两个基因间重组值为 1%。) • 物理图谱 以定位的DNA标记序列如STS作为路 标,以DNA实际长度即bp、kb、Mb 为图距的基因组图谱。
基因与基因组学
人类基因组和基因组学
基因组(genome)
生殖细胞含1套基因组 1套来自父本生殖细胞 体细胞含 2套基因组 1套来自母本生殖细胞
完整的人类基因组包含:
1-22号常染色体 核基因组
X和Y染色体
线粒体基因组
Biblioteka Baidu
限制性内切核酸酶
限制酶:能够识别 DNA链的特定部位 并能进行切割。
EcoRⅠ
一种生物的基因组中,使其表达为新的性状或
用于进一步的研究,是基因操作的核心技术。 包括 DNA 克隆( DNA cloning )和分子杂交 (molecular hybridization)。
重组DNA
构建
转化 扩增(克隆) 分离和检测
foreign DNA
bacterial cell vector restriction endonuclease ligase
•
序列图谱
通过基因组测序得到的,以A、T、 G、C为标记单位的基因组DNA序列
遗传图(genetic map) 又称连锁图(linkage map) 是将每条染色体上的基因或遗传标记的相 对位置经连锁分析确定下来,构成图谱。 遗传距离:
连锁图中两个基因间图距单位 厘摩(cM)
1厘摩(cM)=减数分裂时两个基因间重组 值为1%。
序列图(sequence map)
是通过对基因组DNA进行碱基排列顺序分 析而建立的。 两种技术路线: 1.公共序列路线:即在物理图基础上, 将各个BAC克隆片段切成更短的片段,形成亚 克隆分别进行测序,再将相互重叠的读出序 列组装成连续重叠线。
2.“鸟枪法”测序路线:即直接将基因组
DNA分割成20kb左右的小片段进行随机测序,
SNP与RFLP和STR标记的主要不同之处在于,它
不再以DNA片段的长度变化作为检测手段,而直接 以序列变异作为标记。
物理图(physical map)
l
是要将随机长度的DNA片断在染色体上 的 排列顺序确定下来。这些克隆DNA片断 连接起来,形成重叠克隆群(Conting), 再将一个个(Conting)相连成线状,覆盖整 个染色体。这主要靠单拷贝DNA序列标定 部位(STS)作路标来实现。
2000 年3 月 用“全基因组 鸟枪法”获得 果蝇全基因组 序列。
2000年6月公共领域测序计划工作框架图
二、DNA的鸟枪法测序的主要步骤 • 第一,建立高度随机、插入片段大小为2kb左 右的基因组文库。
• 第二,高效、大规模的末端测序。
• 第三,序列集合。 • 第四,填补缺口。
Shotgun法序列拼接
SNP:是由于单个核苷酸改变而导致的核酸序列多态。
人类99.9%的基因密码是相同的, 而差异不到0.1%,不同人群仅有 140万个核苷酸差异。这些差异是由 “单一核苷酸多样性”(SNP)产生 的,它构成了不同个体的遗传基础。 在整个基因组序列中,人与人之间 的变异仅为万分之一,从而说明人 类不同“种属”之间并没有本质上 的区别。
2.计算机识别:研发计算机GRAIL系统,可 识别每个基因区的外显子-内含子接头区保守序 列。 3.cDNA策略:由组织细胞中表达mRNA,逆 转录合成cDNA片段,称为表达序列标签 (EST),将收获EST定位后,构建的图称为转 录图,是人类基因图雏形。
二、人类基因组计划的进展状况
(1)截至 1998 年 10 月,完成 1.8 × 108bp,
DNA遗传标记
第一代 限制片断长度 分布数量105 (1975) 多态(RFLP) 多态程度较 低,利用价 值受限
第二代 短串连复制序 分布数量>104 高度多态 (1989) 列 长 度 多 态 (STR)
第三代 单核苷酸多态 分布数量 (1996) (SNP) 3×106
一般为二态
单体型分析
• 多态性:人的DNA序列上平均每几百个碱基会出现 一些变异(variation),并按照孟德尔遗传规律
2. 人类基因组中可能有20000-25000个基因, 其中编码蛋白质的外显子只占基因组DNA的1%, 内含子则占24%。每个基因平均长27kb,平均 含有9个外显子。不同个体间,基因编码仅有 0.01%的差异。
3. 基因在各个染色体上的分布是不均 匀的,17、19、22号染色体基因密度最高, 而4、13、18、X、Y染色体基因密度最低。 人类基因组中约20%的区段是没有基因的 “沙漠”。
MboⅠ
G A T C C T A G G G A T C C C C T A G G
5’ BamHⅠ 3’
PstⅠ
G G A T C C C C T A G G C T G C A G G A C G T C
5’ 3’
C T G C A G G A C G T C
重组DNA
重 组 DNA 技 术 ( recombination DNA technique )指将目的 DNA 片段或人工合成的 基因,通过载体在体外重组、转移并插入到另
菌株名 种名 属名
酶的序号
限制性内切核酸酶
HaeⅢ
5’ 3’ 5’ 3’
G G C C C C G G
G A T C C T A G
3’ 5’ 3’ 5’ 3’ 5’ 3’ 5’
5’ 3’
5’ 3’ 5’ 3’ 5’ 3’
G G C C
C C G G
3’ 5’
3’ 5’ 3’ 5’ 3’ 5’
MboⅠ
人类蛋白质
• 61%与果蝇同源
• 43%与线虫同源
• 与蛋白质合成有关 • 46%与酵母同源
的基因占2%
2001年2月16日 人类基因组“精细图”完成(99%)。
2003年4月14日,人类基因组序列图 亦称“完成图”(99.99%),提前绘制成 功。
人类基因组结构的分析
1. 人类基因组DNA全长约3×109bp,相当 3600厘摩(cM)。其中仅有约5%的序列为编码 序列(编码蛋白或tRNA、rRNA等)。
重组DNA技术流程简图
host
限制性内切核酸酶
限制酶:能够识别 DNA链的特定部位 并能进行切割。
TypeⅠ
TypeⅡ TypeⅢ
20世纪人类科技发展史上的三大创举
90年代人类基因组计划 60年代人类首次登上月球 40年代第一颗原子弹爆炸
Contents
• 人类基因组计划 • DNA的鸟枪法序列分析技术
• 比较基因组学及功能基因组研究
第一节 人类基因组计划
一、人类基因组计划的启动
1986年,诺贝尔奖获得者R.Dulbecco(杜尔贝 科)提出人类基因组计划——测出人类全套基因组 的 DNA 碱基序列( 3 × 109 bp )。
美国政府决定于 1990年正式启动HGP,预计用 15 年时间,投入 30 亿美元,完成 HGP。 由国立卫生研究院和能源部共同组成“人类基 因组研究所” 逐渐地,HGP 扩展为多国协作计划,参与者包 括:英、日、法、德和中国(1993年)。