基因组学试题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基因组学试题
1、什么是基因组(5分)?什么是转录组(5份)?说明基因组
合的关系和异同(10分)基因组是生物体(细胞或病毒)中
所有的DNA的总和, 包括所有的基因和基因间区域,包
括染色体之外的遗传物质,如线粒体、叶绿体、质粒等。
基因组:物种内恒定(♀/♂),生物体或细胞内恒定,没有时空变化(?)。
事实上有特例,1、盲鳗(Hugfish) ,性细胞和体细胞DNA 量差异; 2、部分昆虫,性细胞和体细胞染色体数目差异; 3、动物雌雄个体差异
转录组:
?生物体、组织、细胞不同生长发育阶段的转录产物不同。
?生物体不同组织、同一组织不同细胞的转录产物不同。
?生物体、组织、细胞不同环境、不同生理状态下的转录产物
不同。
?转录产物中包含大量不翻译蛋白的RNA,如rRNA; sRNA
2、简述原核生物基因组和真核生物基因组的特点和差异(10分)原核生物基因组
?一条环状DNA;
?只有一个复制起始点;
?有操纵子(Operon)结构
1.结构基因为多顺反子,若干个功能相关的功能基因串联在一起,
手统一调控区调控。
2.数个操纵子还可以受同一个调节基因(regulaterygene),即调节
子(regulon)调控。
?结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质
?基因是连续的,无内含子,转录后不剪接;
?重复序列少,蛋白质基因一般为单拷贝基因,但编码rRNA的基因一般为多拷贝,有利于核糖体快速组装。
真核生物基因组
?复杂的染色体结构,一般有多条染色体
?每条染色体上有多个复制起始点;
?基因组中有大量的重复序列(轻度、中度、高度重复);
?基因是不连续的,有内含子,转录后经过剪接加工成成熟RNA;?有许多来源相同、结构相似、功能相关的基因组成的单一基因簇,或基因家族
?有细胞器基因,真核生物除具有核基因外,还有存在于线粒体和叶绿体中基因,编码同功酶等。
3、什么是遗传图谱(5分)?遗传图谱在基因组研究中的意义
何在(15分)?采用遗传学分析方法将基因或其它DNA标记
按一定的顺序排列在染色体上,这一方法包括杂交实验,家系分析。
标记间的距离(遗传图距)用减数分裂中的交换频率来表示,单位为厘摩(Centi-Morgan, cM), 每单位厘摩定义为1%交换率。
分子生物学方法帮助我们寻找DNA编码信息,但我们首先要知道,在哪里才能找到与目的性状相关的那段DNA.
基因具有多效性,有些表型可能很难直接寻找其相关的DNA序列,遗传分析给我们提供了一个独立的、确定与遗传性状相关联基因的位置的方法。
当关于一个基因的功能还处于假设阶段时,或者当某一特定表
型与DNA的关联还处于推断状态时,遗传分析是唯一的手段。
4、物理图谱的构建方法主要有哪几种(10分)?举例详述一种
物理图谱的构建方法(10分)。
细胞遗传学图谱,包括荧光标记原位杂交将荧光标记的探针与染色体杂交确定分子标记的所
在位置。
?限制图谱,是将限制性酶切位点标定在DNA分子的相对位置。
?顺序标签位点,作通过PCR或分子杂交将小段DNA顺序定位在基因组的DNA区段中。
?连续的文库图谱或基于克隆的基因组作图,根据克隆的DNA片段之间的重叠顺序构建重叠群,绘制物理连锁图。
5、人类基因组计划的主要研究内容有哪些?各内容的意义何在
(15分)?
HGP的主要任务是人类的DNA测序,包括下图所示的四张谱图,此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、
伦理研究、生物信息学和计算生物学、教育培训等目的。
1、遗传图谱(genetic map)
又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。
遗传图谱的建立为基因识别和完成基因定位创造了条件。
意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可
把这一基因定位于这一已知区域,再对基因进行分离和研究。
对于疾病而言,找基
因和分析基因是个关键。
第1代标记:经典的遗传标记,例如ABO血型位点标记,HLA位点标记。
70年中后期,限制性片段长度多态性(RFLP),位点数目大与105,用限制性内切酶特异性切割DNA链,由于DNA的一个“点”上的变异所造成的能切与不能切两种状况,可产生不同长度的片段(等位片段),可用凝胶电泳显示多态性,从片段多态性的信息与疾病表型间的关系进行连锁分析,找到致病基因。
如Huntington症。
但每次酶切2-3个片段,信息量有限。
第2代标记:1985年,小卫星中心(minisatellite core)、可变串联重复VNTR (variable number of tandem repeats)可提供不同长度的片段,其重复单位长度为6至12个核苷酸,1989年微卫星标记(microsatellite marker)系统被发现和建立,重复单位长度为2~6个核苷酸,又称简短串联重复(STR)。
第3代标记:1996年MIT的Lander ES又提出了SNP(single nucleotide polymorphysm)的遗传标记系统。
对每一核苷酸突变率为10-9,双等位型标记,在人类基因组中可达到300万个,平均约每1250个碱基对就会有一个。
3~4个相邻的标记构成的单倍型(haplotype)就可有8~16种。
2、物理图谱(physical map)
物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成
基因组的DNA分子进行测定而绘制的。
绘制物理图谱的目的是把有关基因的遗传
信息及其在每条染色体上的相对位置线性而系统地排列出来。
DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。
因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶
切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。
因此,DNA物理图谱是DNA分子结构的特征之一。
DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA 测序的蓝图。
广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。
制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的
部分酶解法,来说明图谱制作原理。
用部分酶解法测定DNA物理图谱包括二个基本步骤:
(1)完全降解:选择合适的限制性内切酶将待测DNA链(已经标记放射性同位素)完全降解,降解产物经凝胶电泳分离后进行自显影,获得的图谱即为组成该DNA链的酶切片段的数目和大小。
(2)部分降解:以末端标记使待测DNA的一条链带上示踪同位素,然后用上述相同酶部分降解该DNA链,即通过控制反应条件使DNA链上该酶的切口随机断裂,而避免所有切口断裂的完全降解发生。
部分酶解产物同样进行电泳分离及自显影。
比
较上述二步的自显影图谱,根据片段大小及彼此间的差异即可排出酶切片段在DNA 链上的位置。
下面是测定某组蛋白基因DNA物理图谱的详细说明。
完整的物理图谱应包括人类基因组的不同载体DNA克隆片段重叠群图,大片段限制性内切酶切点图,DNA片段或一特异DNA序列(STS)的路标图,以及基因组中广泛存在的特征型序列(如CpG序列、Alu序列,isochore)等的标记图,人类基因组的细胞遗传学图(即染色体的区、带、亚带,或以染色体长度的百分率定标记),最终在分子水平上与序列图的统一。
基本原理是把庞大的无从下手的DNA先“敲碎”,再拼接。
以Mb、kb、bp作为图距,以DNA探针的STS(sequence t ags site)序列为路标。
1998 年完成了具有52,000个序列标签位点(STS),并覆盖人类基因组大部分区域的连续克隆系的物理
图谱。
构建物理图的一个主要内容是把含有STS对应序列的DNA的克隆片段连接成相互重叠的“片段重叠群(contig)”。
用“酵母人工染色体(YAC)作为载体的载有人DNA片段的文库已包含了构建总体覆盖率为100%、具有高度代表性的片段重叠群”,近几年来又发展了可靠性更高的BAC、PAC库或cosmid库等。
3、序列图谱
随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。
DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。
通过测序得到基因组的序列图谱。
大规模测序基本策略:
逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。
全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接
将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)。
4、基因图谱
基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因
序列、位置及表达模式等信息的图谱。
在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。
其原理是:所有生物性状和疾病都是由结构或功能蛋白质决定的,而已知的所有
蛋白质都是由mRNA编码的,这样可以把mRNA通过反转录酶合成cDNA或称作EST的部分的cDNA片段,也可根据mRNA的信息人工合成cDNA或cDNA片段,然后,再用这种稳定的cDNA或EST作为“探针”进行分子杂交,鉴别出与转录有关的基因。
用PolyA互补的寡聚T或克隆载体的相关序列作为引物对mRNA双端尾侧的几百个bp进行测序得到EST(表达序列标签)。
2000年6月,EMBL中EST数量已有4,229,786。
基因图谱的意义:在于它能有效地反应在正常或受控条件中表达的全基因的时空
图。
通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以
了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。
人类基因组是一个国际合作项目:表征人类基因组,选择的模式生物的DNA测序和作图,发展基因组研究的新技术,完善人类基因组研究涉及的伦理、法律和社会
问题,培训能利用HGP发展起来的这些技术和资源进行生物学研究的科学家,促进人类健康
6、有一个海洋经济动物,进行基因组学研究,你认为应该如何制
定详细的研究计划(15分)。
2)基因组较小,基因数目少,1.远大于原核生物基因组,多复制起点,复制子较短;
大多只含有一条环状染色体,只有一个复制起点;
3)基因结构紧凑,大部分序列
用来编码蛋白质,重复序列和不编码序列少;但编码顺序一般不
会重叠,即不会出现基因重叠现象;
4)具操纵子结构,即数个功能
相关的结构基因串联在一起,受一个调节区调节;数个操纵子还可以由一个共同调节基因(regulatory gene)即调节子(regulon)调控;
5)结构基因大都是单拷贝,
rRNA的基因rrn往往是多拷贝;
6)DNA分子中具有各种功能的
识别区域. 如复制起始区OriC,复制终止区TerC,转录启动区和终止区等。
这些区域往往有特
殊的顺序。
2.DNA与蛋白质结合形成染色体,一般为多条;
3.基因转录产物为单顺反子,一个结构基因经过转录和翻译生
成一个mRNA分子和一条多肽链。
4.基因组中不编码的区域多于
编码区域,如在人基因组中编码序列只占2~3%。
5.存在重复序列,重复次数可达百万次以上。
6.大部分基因含有内含子,基因是不连续的。
7)在基因或操纵子的终末往往
具有特殊的终止顺序,它可使转
录终止和RNA聚合酶从DNA
链上脱落。
(1) 基因组太大,必需分散测序。
对整个基因组进行测序,必需将基因组分解,分别测序,然后进行组装.为了使DNA顺序的组装不发生错乱,必须寻找可以指导以及校正排序的位标.
(2) 基因组存在大量重复顺序,会干扰排序
(3) 分子生物学方法帮助我们寻找DNA编码信息,但我们首先要知道,在哪里才能找到与目的性状相关的那段DNA.
(4) 基因具有多效性,有些表型可能很难直接寻找其相关的
DNA序列,遗传分析给我们提供了一个独立的、确定与遗传性状相关联基因的位置的方法。
(5) 当关于一个基因的功能还处于假设阶段时,或者当某一特
定表型与DNA的关联还处于推断状态时,遗传分析是唯一的手段。
(6)遗传图谱是构建物理图谱并测序的一个重要前提步骤
遇到失意伤心事,多想有一个懂你的人来指点迷津,因他懂你,会以我心,换你心,站在你的位置上思虑,为你排优解难。
一个人,来这世间,必须懂得一些人情事理,才能不断成长。
就像躬耕于陇亩的农人,必须懂得土地与种子的情怀,才能有所收获。
一个女子,一生所求,莫过于找到一个懂她的人,执手白头,相伴终老。
叫人无怨无悔,愿以自己的一生来交付。
即使芦花暖鞋,菊花枕头,也觉温暖;即使粗食布衣,陋室简静,也觉舒适,一句“懂你”,
懂得是彼此的欣赏,是灵魂的轻唤,是惺惺相惜,是爱,是暖,是彼此的融化;是走一段很远的路,蓦然回首却发现,我依然在你的视线里;是回眸相视一笑的无言;是一条偏僻幽静的小路,不显山,不露水,路边长满你喜爱的花草,静默无语却馨香盈怀,而路的尽头,便是通达你心灵的小屋……
瑟瑟严冬,窗外雪飘,絮絮自语说了这多,你可懂我了吗?若你知晓,无需说话,只报一声心灵的轻叹,那,便是我的花开春暖。
你相不相信,人生有一种念想,不求奢华不求结果,不求你在我身边,只愿有一种陪伴暖在心灵,那,便是懂得。
有人懂得是一种幸福,懂得别人是一种襟怀,互为懂得是一种境界。
懂得,真好!。