基因组学-Genomics-知识考点汇总

基因组学-Genomics-知识考点汇总

•基因组(Genome:Gene+chromosome)细胞或生物体中一套完整的单倍体遗传物质

•基因组学(Genomics)最早Thomas Roderick在1986年提出,包括基因组作图、测序和分析。可分为结构基因组学和功能基因组学。

一、结构基因组学

1.遗传图(Genetic Mapping Genomes) : Based on the calculation of recombination frequency

by linkage analysis .通过亲本的杂交,分析后代的基因间重组率,并用重组率来表示两个基因之间距离的线形连锁图谱

每条染色体组成一个连锁群,所有染色体的连锁群组成的图谱即构成基因组遗传图。

重组率代表基因位点之间的相对距离。在遗传作图中,人们把一个作图单位定义为1厘摩(cM),1cM等于1%的重组率。

提高遗传作图的分辨率:选用不同的杂交群体;增加杂交群体的数目;增加分子标记的数目;扩大分子标记的来源

分子标记:绘制基因组遗传图需要的坐标点。

分子标记的主要来源是染色体上存在的大量等位基因。在DNA水平上,两个基因间一个碱基的差异就足以形成等位基因。

2.物理图(physical map):指DNA序列上两点的实际距离,它是以DNA的限制酶片段或

克隆的大片段的基因组DNA分子为基本单位,以连续的重叠群为基本框架,通过遗传标记将重叠群或基因组DNA分子有序排列于染色体上。

物理图的绘制: Based on molecular hybridization analysis and PCR techniques

杂交法;指纹法;荧光原位杂交技术。

3.基因组序列测定: Sequencing methods: the chain termination procedure;

Map-based clone by clone strategy;

Whole genome shotgun (WGS) strategy;

Sequence assembly;

•传统基因组测序的方法:克隆步移法(BAC-by-BAC Strategy)和全基因组鸟抢法(Whole Genome Shotgun Strategy)。

•基因组测序战略:基于物理图的克隆连克隆法、随机挑选BAC克隆测序、逐步步移法(Lee Hood)、全基因组鸟枪法(Craig Venter)

4.基因组序列解析(Annotating Genome Sequence) :其目标是建立高密度的遗传图、高分

辨率的物理图和转录图,最终完成全基因组序列测定和注解,是功能基因组学的基础基因组注解异常复杂,它是一个繁杂的复合体,既包含了进化历史上原封未动的部分,也有大量的进化史上重要历史事件的遗迹。

基因组有它自身的规律,但是一些“不和谐的韵律”,如从病毒或者原核生物感染或寄生得到的基因组片段、转座元件、假基因以及重复序列的存在,构成了理解基因组结构的四大陷阱。

Annotating a Genome Sequence

(1). Gene prediction by software;

Gene fiding: Find genes and gene structures from genomic sequences

Problems

Finding the parts: 收集可靠的信息,并识别信号或传感器作为整个基因的一部分。可能是一些程序的端点,例如Splice Predictor,MZEF用于找寻外显子。

Putting parts together: 使用适当和有效的算法将部分组合在一起,产生完整的基因模型。许多程序目前可用于全基因预测(GenScan,GeneMark.hmm,Grail,Glimmer等),这些程序基于动态规划和基于HMM(隐马尔可夫算法),将部分组合成整体。

Three types of information:

Signals (signal sensors): 短子序列例如剪接位点,poly A信号和其他基序。信号传感器可以表示为模式或权重矩阵。它们可以通过序列比对,统计方法或神经网络获得。.

Content statistics (content sensors): 描述了编码区的非随机性质,例如密码子偏好和反密码子偏好性。

Similarity:与已知基因的相似性可有助于提高signal sensor和contenst statistics的准确性。

(2). Gene identification:

expressed sequence tags (ESTs),

homology analysis,

mutations,

直系同源物:由共同的祖先基因进化而来的不同生物的同源基因

旁系同源物:一个物种中通过基因复制而演化形成的同源基因

(类似基因:非来自相同祖先的基因,但通过会聚进化而具有相似的功能特征的一个实例是糜蛋白酶和枯草杆菌蛋白酶的类似催化位点)

How to measure similarity

Identity: Two proteins that have a certain number of amino-acids in common at aligned positions are said to be identical to that degree. (i.e. if they have 43 residues out of a total of 100 in common they are 43% identical).

Similarity: Often a number of residues will be replaced by ones of similar physico-chemical properties. Such mutations may be termed conservative and one may define various scoring matrices to quantify how similar the two sequences are, taking into account conservative mutations. Such scores will be measures of similarity.

Homology: If and only if two proteins are evolutionarily related and descend from a common ancestor, they are called homologous. Similarity and homology are two different concepts and must not be confused.

comparative analysis between genomes;

Pair-wise sequence alignment is a foundational operation unit for much of the bioinformatics analysis

(3).Transcriptome & Proteome;

二、功能基因组学

1、定义:利用结构基因组提供的信息,在基因组或系统水平上全面分析基因的功能,使生物学研究从对单一基因或蛋白质研究转向对多个基因或蛋白质同时进行的系统研究,是在基因组静态(碱基序列)清楚后转入对基因组动态(生物学功能)的研究。应用高通量的方法来平行研究大量基因。

2、任务:进行基因组功能注释(Genome annotation),了解基因的功能,掌握基因的产物及其在生命活动中的作用。从基因组的整体水平上来理解基因的功能与进化。

3、功能基因组研究内容:突变体库的构建、全长cDNA克隆与测序、获得DNA芯片等基因转录图谱、高通量测序(NGS)转录组、植物全基因组关联分析(GWAS)

、高通量的遗传转化鉴定系统、生物信息技术平台与相应数据库的构建

(1)突变体库的构建

变异是功能分析的基础。突变体是功能基因组学研究的重要材料。

植物突变可在分子、细胞、组织、器官和个体等不同的水平上表现。一般分3种方法:

1.按突变方法分自然突变、物理化学诱变、DNA插入突变;

2.按遗传背景分为普通突变体库、近等基因系突变体库和等基因系突变体库;

3.按引起突变的分子机制分功能丧失突变和功能获得性突变

(2)基因克隆的一般方法

植物的生长发育是在多个代谢和生理过程基础上所发生的基因在时空上表达的综合现象,分离潜在的各种有价值的基因,对植物特别是作物品种改良具有重要意义。

因此,对基因的克隆并发展与之相关的技术非常重要。

(3)高通量测序转录组技术

转录组测序亦称RNA-Seq(RNA Sequencing),是指利用第二代高通量测序技术进行

cDNA测序,全面快速地获取某一物种特定器官或组织在某一状态下的几乎所有转录本RNA-seq:双链均能被随机测序以致不能确定转录本方向

ssRNA-seq:通过消除双链中的反向链来特异识别转录本方向

ssRNA-seq:通过给5’末端脱磷酸->3’末端加adapter->5’复磷酸->5’加adapter来识别转录本方向

NGS在转录组学研究中应用:转录组学:在整体水平上研究细胞中基因转录的情况及转录调控规律的学科,研究已知基因的SNP、Indel等,研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。测量基因表达水平,检测部分转录本的表达水平,发现新的基因和转录本,检测发生在外显子部分的基因突变,发现基因融合等。综合mRNA-lncRNA共表达分析以及microRNA靶基因分析,可以有效的解析lncRNA参与生物过程的分子机制

方法:功能克隆法,同源序列法,转座子或T-DNA标签法,表达序列标签法(EST)或全长cDNA文库构建法,差异表达基因分离技术以及最新的高通量测序转录组

(4)基因的图位克隆

图位克隆(map-based cloning):又称定位克隆(positional cloning),1986年由剑桥大学的Alan Coulcon提出。

该方法分离基因是根据目的基因在染色体上的位置进行基因克隆的一种方法。在利用分子标记技术对目的基因进行精确定位的基础上,使用与目的基因紧密连锁的分子标记筛选DNA 文库,从而构建目的基因区域的物理图谱,再利用此物理图谱通过染色体步行逼近目的基因最终找到包含该目的基因的克隆,最后通过遗传转化和功能互补验证最终确定目的基因的碱基序列。

图位克隆的特点:无需预先知道基因的DNA序列,也无需预先知道其表达产物的有关信息。

但应有以下两方面的基本情况:

1.有一个根据目的基因的有无建立起来的遗传分离群体,如F2、DH等。

2.开展以下几项工作:

找到与目的基因紧密连锁的分子标记;

遗传作图和物理作图将目标基因定位在染色体;

构建含有大插入片断的基因组文库;

特定连锁探针筛选基因组文库;

用获得阳性克隆构建目的基因区域的重叠群;

通过染色体步行、登陆或跳跃获得带有目标基因的大片段克隆;

亚克隆小片段克隆;

通过遗传转化和功能互补验证目的基因的碱基序列。

(5)植物遗传转化技术的发展

定义:应用DNA重组技术,将外源基因通过生物、物理或化学手段导入植物基因组,以获得外源基因稳定遗传和表达的植物遗传改良体。

技术方法:

基因枪轰击法;

农杆菌介导法;

PEG转化法;

电激法(目前很少应用);

低能离子束介导法(该技术不成熟)。

4、在植物功能基因组研究中发挥重要作用的技术:

植物转化(Plant Transformation)

增强子捕获(Enhancer trapping)

插入突变(Transposon /T-DNA Insertion)

基因敲除(Gene Knockout)

基因沉默(Gene Silencing)

异位表达(Ectopic Expression)

5、水稻基因组学

目标1: 鉴定水稻基因组结构、变异和群体遗传学分析

目标2:基因组变异与表型变异关联(开发基因组学研究的新方法,系统鉴定和挖掘水稻品种的遗传多样性,开展高效的水稻功能基因组研究)

目标3:阐明水稻的驯化和遗传育种改良史

具体研究工作:

1、水稻4号染色体精细测序、水稻高通量转录组分析和高通量基因型鉴定

2、建立水稻重要农艺性状的全基因组关联分析研究体系和分析方法

3、运用基因组学研究手段开展水稻驯化起源和相关性状基因的克隆和功能研究

4、其它植物基因组相关研究

水稻全基因组关联分析分析框架

最后一张ppt老师留的思考题:

1、什么叫基因组学?

基因组学最早由Thomas Roderick在1986年提出,是研究生物基因组和如何利用基因的一门学问,包括基因组作图、测序和分析。可分为结构基因组学和功能基因组学,该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学,和工业领域的重大问题。

2、基因组的研究内容?

基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics),又被称为后基因组(postgenome)研究,成为系统生物学的重要方法。

功能基因组学的研究内容:人类基因组DNA 序列变异性研究、基因组表达调控的研究、模式生物体的研究和生物信息学的研究等。

结构基因组学:其目标是建立高密度的遗传图、高分辨率的物理图和转录图,最终完成全基因组序列测定和注解,是功能基因组学的基础。

3、基因组学有哪些研究手段和方法?

通过建立高密度的遗传图、高分辨率的物理图和转录图,最终完成全基因组序列测定和注解(包括DNA层次、蛋白质层次和代谢调控过程层次)。测序技术有:全基因组鸟抢法、基于物理图的克隆连克隆法、生物芯片技术、第二代测序技术(454高通量测序、Illumina Solexa 测序技术、Solid测序技术)、第三代测序技术(单分子测序)

4、水稻基因组学研究的主要进展?

开发基于测序的基因分型技术及对重组群体的遗传分析

建立水稻重要农艺性状的全基因组关联分析研究体系和分析方法

水稻单倍体图谱构建&品质、产量和抗性等复杂性状关联分析

水稻开花期等重要农艺性状的关联分析及候选基因的精确定位

水稻基因鉴定和功能研究

文献概括:

目标1: 鉴定水稻基因组结构、变异和群体遗传学分析

目标2:基因组变异与表型变异关联(开发基因组学研究的新方法,系统鉴定和挖掘水稻品种的遗传多样性,开展高效的水稻功能基因组研究)

目标3:阐明水稻的驯化和遗传育种改良史

具体研究工作:

⑴水稻4号染色体精细物理图的构建及水稻基因组精确测序;

⑵通过比较基因组和功能基因组,发现了一系列在水稻抗热,抗旱和抗盐生理过程中起重要作用的基因;

⑶以第二代测序仪为基础的高通量功能基因组研究平台为大规模发现和利用水稻遗传资源开辟了有效的新途径;

⑷利用基因组学和群体遗传学的方法来揭示水稻驯化过程和栽培稻的起源。

分子遗传学要点整理

Chapter 1: Genomes, Transcriptomes and Proteomes 1. 概述 基因组(Genome):指生物的整套染色体所含有的全部DNA或RNA 序列。基因组是地球上每一物种具有的生物学信息的存储库。 基因组学(Genomics):指研究生物的整个基因组,涉及基因组作图、测序和功能分析的一门学科。 基因组所包含的生物信息的利用需要酶及其他参与基因组表达过程中一系列复杂生化反应的蛋白质的协同活性。 基因组表达的最初产物是转录组,即那些含有细胞在特定时间所需生物信息、编码蛋白质的基因衍生而来的RNA分子的集合。转录组由转录过程来维持。 基因组表达的第二个产物是蛋白质组,即细胞中那些决定细胞能够进行生化反应的所有蛋白质组分。这是通过翻译过程来完成的。 2.1 Genes are made of DNA 奥地利神父孟德尔1865年根据7个碗豆性状的实验提出了遗传因子假说,认为每个性状由遗传因子控制,并提出了遗传因子的分离与自由组合两大遗传规律。 证明基因由核酸 (DNA或RNA) 组成的3个著名实验: ①肺炎双球菌的转化试验;DNA是遗传物质 ②噬菌体感染实验;只有DNA是联系亲代和子代的物质 ③烟草花叶病毒的感染实验。RNA也是遗传物质 2.2 The structure of DNA A. Nucleotides and polynucleotides B. The model of double helix DNA 晶体X射线衍射图谱?为揭示DNA分子的二级结构提供了重要实验证据 a. Watson and Crick (1953) 提出的 DNA双螺旋结构模型: "?DNA分子通常以右手双螺旋形式存在,两条核苷酸链反向平行,且互为互补链。 "?戊糖-磷酸骨架在分子的外铡,在分子表面形成大沟和小沟,碱基堆积于螺旋内部。 "?碱基间通过氢键相互连接,A 和T 以2个氢键配对, G和C 以3个氢键配对。"?螺旋中相邻碱基间相隔0.34nm ,每10个碱基对螺旋上升一圈,螺距为 3.4nm ,直径为2.37 nm 。 b. DNA双螺旋结构的稳定力: ??碱基间形成的氢键/ ??相邻碱基间的疏水堆积力/ ??碱基相互作用的范德华力 尽管氢键使得双链中的碱基间的配对具有特异性(只有互补的两条链之间才能形成DNA双链),但其对于双螺旋的总体上的稳定性并无太大贡献。 核酸分子的稳定性的根源在于碱基对之间的疏水堆积力。作为芳香族化合物,

基因组学

名词解释: 第一章基因组 遗传图(连锁图):指基因或DNA标记在染色体上的相对位置与遗传距离。单位是厘摩cM (基因或DNA片段在染色体交换过程中分离的频率)。 物理图:以已知核苷酸序列的DNA片段(序列标签位点,sequence-tagged site, STS)为“路标”,以碱基对作为基本测量单位(图距)的基因组图。 转录图:以EST(expressed sequence tag ,表达序列标签)为标记,根据转录顺序的位置和距离绘制的图谱。 EST:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分cDNA的5'或3'端序列称为表达序列标签(EST),一般长300-500 bp左右。 序列图(分子水平的物理图):序列图是指整个人类基因组的核苷酸序列图,也是最详尽的物理图。既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和。 基因:合成有功能的蛋白质或RNA所必需的全部DNA序列,即一个基因不仅包括编码蛋白质或RNA的核酸序列,还应包括为保证转录所必需的调控序列。 基因组(genome):生物所具有的携带遗传信息的遗传物质的总和。 基因组学(genomics):涉及基因组作图、测序和整个基因组功能分析的一门学科。 C值:单倍体基因组的DNA总量,一个特定种属具有特征C值 C值矛盾(C value paradox):指一个有机体的C值和其编码能力缺乏相关性。 单一序列:基因组中单拷贝的DNA序列。 重复序列:基因组中多拷贝的DNA序列。 复杂性(complexity):基因组中不同序列的DNA总长。

高度重复序列(highly repetitive sequence):重复片段的长度单位在几个到几百个碱基对(base pair,bp)之间(一般不超过200 bp),串联重复频率很高(可达106以上),高度重复后形成的这类重复顺序称为高度重复顺序。 中度重复序列(intermediate repetitive sequence ):重复长度300~7000 bp不等,重复次数在102~105左右。 断裂基因(split gene):指基因的编码序列(外显子)在DNA分子上是不连续排列的,而是被不编码的序列(内含子)所隔开。 基因簇(gene cluster):由一个基因产生多次拷贝,具有几乎相同的顺序,成簇地排列在同一条染色体上。 重叠基因(overlapping gene):是指两个或两个以上的基因共有一段DNA序列。 持家基因(housekeeping gene):几乎在一切体细胞中均能被表达的基因称之。 奢侈基因(luxury gene):在高等生物不同组织里面特异性表达的基因称之。 假基因(pseudogene):也称拟基因,指在多基因家族中,某些成员不产生有功能的基因产物,这些基因称为假基因,常用ψ表示。 第二章遗传图绘制 遗传作图(genetic mapping):采用遗传学分析方法将基因或其他DNA分子标记标定在染色体上构建连锁图称之为遗传图或遗传连锁图(genetic linkage map)。 物理作图(physical mapping):采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组的实际位置所构建的位置图称之为物理图(physical map)。 基因组图(genome map):遗传图和物理图通过共同的作图标记可以相互校正,由此获得的基因组连锁图。

基因组学

基因组复习 基因组(genome),又称染色体组一个物种单倍体的染色体数目,物种全部遗传信息的总和基因组学研究的最终目标: 获得生物体全部基因组序列; 鉴定所有基因的功能; 明确基因之间的相互作用关系; 阐明基因组的进化规律。 经典遗传学:在20世纪初,遗传学刚刚诞生的时候,遗传学家的工作主要是鉴别感兴趣的基因,确定这些基因在染色体上的位置。第一个环节:寻找自发突变体,或者利用物理、化学因素诱发突变。第二个环节:通过连锁分析确定新基因与已知基因的相互关系,绘制遗传连锁图。 基因组学的研究内容 结构基因组学:基因定位;基因组作图;测定核苷酸序列 功能基因组学:又称后基因组学(postgenomics)基因的识别、鉴定、克隆;基因结构、功能及其相互关系;基因表达调控的研究 蛋白质组学:鉴定蛋白质的产生过程、结构、功能和相互作用方式 遗传图谱(genetic map)采用遗传分析的方法将基因或其它DNA序列标定在染色体上构建连锁图。 遗传标记:有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。构建遗传图谱就是寻找基因组不同位置上的特征标记。包括:形态标记;细胞学标记;生化标记;DNA 分子标记 所有的标记都必须具有多态性!所有多态性都是基因突变的结果! 形态标记:形态性状:株高、颜色、白化症等,又称表型标记。数量少,很多突变是致死的,受环境、生育期等因素的影响控制性状的其实是基因,所以形态标记实质上就是基因标记。 细胞学标记 明确显示遗传多态性的染色体结构特征和数量特征:染色体的核型、染色体的带型、染色体的结构变异、染色体的数目变异。优点:不受环境影响。缺点:数量少、费力、费时、对生物体的生长发育不利 生化标记 又称蛋白质标记 就是利用蛋白质的多态性作为遗传标记。如:同工酶、贮藏蛋白 优点:数量较多,受环境影响小 缺点:受发育时间的影响、有组织特异性、只反映基因编码区的信息 DNA分子标记:简称分子标记以DNA序列的多态性作为遗传标记 优点: 不受时间和环境的限制 遍布整个基因组,数量无限 不影响性状表达 自然存在的变异丰富,多态性好 共显性,能鉴别纯合体和杂合体 限制性片段长度多态性(restriction fragment length polymorphism,RFLP)

基因与基因组知识点资料整理总结

第一章基因与基因组 1.基因的概念:基因是指合成有功能的蛋白质多肽链或RNA所必需的全部核酸序列(通常指DNA)。 2.基因的结构: ①真核生物的结构基因不是连续编码的,而是由编码序列和非编码序列两部分构成,二者相互间隔排列,因此这种基因又称作割裂基因(split gene). ②人类编码基因主要由外显子、内含子和侧翼序列组成. ③能转录、并存在于成熟RNA中的序列称为外显子(exon) ④能转录、但不存在于成熟RNA中的序列称为内含子(intron) (注:GT-AG法则:每个内含子的5’端开始的两个核苷酸都是GT,3’端末尾的两个核苷酸都是AG。) ⑤不同数目的外显子和内含子组成的各个基因大小各不相同;无内含子的基因一般较小,有较大内含子的基因一般较大。 ⑥每个结构基因的第一个外显子和最后一个外显子外侧,即基因的5′端和3′端都有一段不被转录的DNA序列,对基因的转录表达及表达水平具有重要的调控作用。包括:启动子、增强子和终止子,属顺式调控因子,称为调控序列。 (启动子 (Promoter),通常位于基因转录起点上游的100bp范围内,是RNA聚合酶的结合部位,促进转录过程,包括TATA框、Hogness框(TATA box, Hogness box)、CAAT框(CAAT box)和GC框(GC box)。 终止子 (Terminator),一段回文序列以及特定的序列,例如:5’-AATAAA-3’是RNA停止工作的信号。 增强子(Enhancer),启动子上游或下游的一段DNA序列,无明显方向性,但具有组织特异性,可增强启动子转录的效率)

3.基因家族、基因簇和假基因 ①基因家族 (gene family):基因组中来源相同、结构相似、功能相关且常成簇存在的一组基因。 ②基因簇:家族成员成簇排列在同一条染色体上,形成一个基因簇;不同成员成簇地分布在几条不同的染色体上,形成几个基因簇。基因簇成员可能同时表达,也可能在不同发育阶段或不同部位表达。 ③假基因(pseudogene):具有部分基因结构,但在进化中由于突变而不能活性表达产生蛋白。 4.基因表达:DNA序列所携带的遗传信息,通过转录和翻译形成具有生物活性的蛋白质的过程。 5.转录:在细胞核中,以DNA的反编码链为模板,从转录起始点开始,以碱基互补的形式,合成RNA的过程。 过程: hnRNA→剪接→戴帽→加尾→mRNA 6.翻译:mRNA把转录的遗传信息“解读”成为多肽链的不同氨基酸和氨基酸排列顺序的过程。 7.基因/非基因序列: ①基因序列:基因组中决定蛋白质的DNA序列。 ②非基因序列:基因组中除基因以外的全部DNA序列。 8.编码/非编码序列: ①编码序列:编码RNA和蛋白质的DNA序列 ②非编码序列:基因中的内含子(intron)序列+基因间序列 9.单一序列/重复序列: ①单一序列:在基因组中只出现过一次的DNA序列 ②重复序列:在基因组中重复出现的DNA序列

基因组

基因(Gene):它是遗传的基本结构和功能单位。能够编码特定功能的蛋白质或RNA。从化学角度观察,基因则是一段具有特定功能和结构的连续的DNA序列,是构成巨大遗传单位染色体的重要组成部分。 基因组(genome):是指细胞或生物体的遗传物质的总量。即整套染色体所包含的DNA分子以及DNA分子所携带的全部遗传信息。 基因组学(Genomics):简单地定义为研究基因组结构和功能的科学。具体:指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。包括对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱),核苷酸序列分析,基因定位和基因功能分析。 基因家族:(gene family)指一群具有一致的或相似顺序的基因,编码相似的蛋白产物。 C值:是指一个单倍体基因组所含DNA的总量。 C值悖理(C—V alue paradox):生物的复杂性与基因组大小并不完全成比例增加。 单一顺序:基因组中单拷贝的DNA顺序 重复顺序:多拷贝的DNA顺序 复杂性:不同序列的DNA总长 基因定位(gene mapping):根据重组值确定不同基因在染色体上的相对位置和排列顺序的过程。 染色体图(chromosome map)又称基因连锁图(linkage map)或遗传图(genetic map)根据基因之间的交换值(或重组值),确定连锁基因在染色体上的相对位置而绘制的一种简单线性示意图。 图距(map distance):;两个基因在染色体图上距离的数量单位称图距。图距单位称为厘摩(cM),1%交换值=1cM 染色体步移(chromosomal walking)是一种用来富集一系列彼此重叠的DNA限制片段的分子生物学技术 指纹:DNA样品所具有的特定DNA片段组成 指纹作图概念:是将目的基因的标记探针同大分子量的DNA分子(染色体)进行杂交,以确定其在染色体上的位置的一种基因定位技术。 序列标签位点或STS(sequence tagged site):是一小段序列已知长度在100到500 bp的DNA 顺序。 基因组测序的覆盖面(coverage):测序获得的序列总长与单倍体基因组序列总长之比。 覆盖面越大遗漏的序列越少。计算公式:P0=e-m,P为丢失的概率;m为覆盖面;e自然对数底数,(e ≈ 2.7182818284 ) 搜寻基因:根据已知的序列人工判读或计算机分析寻找与基因有关的序列;实验研究,看其能否表达基因产物及其对表型的影响。 开放阅读框(ORF,open reading frame):一个没有终止编码的密码子序列。一个DNA序列可能有3种阅读框,但只有一种具有编码的作用。 封闭阅读框:终止密码子频繁出现,不能生成蛋白。 同源查询(homology search):利用已存入数据库中的基因序列与待查的基因组序列进行比较,从中查找可与之匹配的碱基序列及其比例用于识别基因的方法。可以弥补ORF扫描的不足 基因敲除(gene knock out),是指对一个结构已知但功能未知的基因,从分子水平上设计实验,将该基因去除,或用其它顺序相近基因取代,然后从整体观察实验动物,推测相应基因的功能。 染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。 转录物组:在某一特定条件下单个或一组细胞所具有的mRNA的总和 核型:是指染色体组在有丝分裂中期的表型, 是染色体数目、大小、形态特征的总和。 核型模式图:一个体细胞内的全套染色体按其相对衡定的形态特征排列的图象。 核型分析:又叫染色体组型分析,是在对染色体进行测量计算的基础上, 进行分组、排队、配对, 并进行形态分析的过程

基因组学复习题

第1章 1)什么是C-值悖理什么是N-值悖理 C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类 mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型 tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因假基因是如何形成的 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达为什么 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族什么是超基因家族 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别为什么会产生这些差别 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在5 Mb以下; 3)缺少重复序列; 4)很少非编码序列。

基因组学-Genomics-知识考点汇总

基因组学-Genomics-知识考点汇总 •基因组(Genome:Gene+chromosome)细胞或生物体中一套完整的单倍体遗传物质 •基因组学(Genomics)最早Thomas Roderick在1986年提出,包括基因组作图、测序和分析。可分为结构基因组学和功能基因组学。 一、结构基因组学 1.遗传图(Genetic Mapping Genomes) : Based on the calculation of recombination frequency by linkage analysis .通过亲本的杂交,分析后代的基因间重组率,并用重组率来表示两个基因之间距离的线形连锁图谱 每条染色体组成一个连锁群,所有染色体的连锁群组成的图谱即构成基因组遗传图。 重组率代表基因位点之间的相对距离。在遗传作图中,人们把一个作图单位定义为1厘摩(cM),1cM等于1%的重组率。 提高遗传作图的分辨率:选用不同的杂交群体;增加杂交群体的数目;增加分子标记的数目;扩大分子标记的来源 分子标记:绘制基因组遗传图需要的坐标点。 分子标记的主要来源是染色体上存在的大量等位基因。在DNA水平上,两个基因间一个碱基的差异就足以形成等位基因。 2.物理图(physical map):指DNA序列上两点的实际距离,它是以DNA的限制酶片段或

克隆的大片段的基因组DNA分子为基本单位,以连续的重叠群为基本框架,通过遗传标记将重叠群或基因组DNA分子有序排列于染色体上。 物理图的绘制: Based on molecular hybridization analysis and PCR techniques 杂交法;指纹法;荧光原位杂交技术。 3.基因组序列测定: Sequencing methods: the chain termination procedure; Map-based clone by clone strategy; Whole genome shotgun (WGS) strategy; Sequence assembly; •传统基因组测序的方法:克隆步移法(BAC-by-BAC Strategy)和全基因组鸟抢法(Whole Genome Shotgun Strategy)。 •基因组测序战略:基于物理图的克隆连克隆法、随机挑选BAC克隆测序、逐步步移法(Lee Hood)、全基因组鸟枪法(Craig Venter) 4.基因组序列解析(Annotating Genome Sequence) :其目标是建立高密度的遗传图、高分 辨率的物理图和转录图,最终完成全基因组序列测定和注解,是功能基因组学的基础基因组注解异常复杂,它是一个繁杂的复合体,既包含了进化历史上原封未动的部分,也有大量的进化史上重要历史事件的遗迹。 基因组有它自身的规律,但是一些“不和谐的韵律”,如从病毒或者原核生物感染或寄生得到的基因组片段、转座元件、假基因以及重复序列的存在,构成了理解基因组结构的四大陷阱。

基因组学考试 名词解释

武汉大学李阳生老师基因组学考试名词解释 名词解释 1.基因= 由不同的DNA片段共同组成的一个完整的表达单元,有一个特定的表达产物, 表达产物可以是RNA分子,亦可为多肽分子。 2.遗传图谱=以遗传距离表示基因组内基因座位相对位置的图谱。 3.遗传作图= 采用遗传学分析方法将基因或其他DNA顺序标定在染色体上构建连锁 图。 4.DNA标记= 一段DNA顺序,具有2个或多个不同的可以区分的版本,即等位形式。 AFLP、STS、RALP、RFLP、SSR、SNP等。 5.重组热点= 染色体的某些位点之间比其他位点之间由更高的交换频率,被称为重组 热点。 6.共分离= 在有性繁殖的后代,这种基因附近有一个紧密连锁的分子标记与连锁的基 因有最大的可能同时出现在同一个体中,这一现象被称为共分离。 7.物理图谱= 指表示DNA序列上DNA标记之间实际距离的图。 8.物理作图= 采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组实 际位置。 9.重叠群= 相互重叠的DNA片段组成的物理图称为重叠群。 10.稀有切点限制酶=指该酶识别的碱基顺序在基因组中只有很少数量,可产生较大的 DNA片段。 11.DNA指纹= 小卫星DNA具有高度的可变性,不同个体,彼此不同。但“小卫星DNA” 中有一段序列则在所有个体中都一样,称为“核心序列”。如果把核心序列串联起来作为探针,与不同个体的DNA进行分子杂交,就会呈现出各自特有的杂交图谱,它们与人的指纹一样,具有转移性和特征性,因人而异,因此被称作“DNA指纹”(DNA fingerprint)。 12.染色体步移=从第一个重组克隆插入片段的一端分离出一个片段作为探针从文库中 筛选第二个重组克隆,该克隆插入片段含有与探针重叠顺序和染色体的其他顺序。 从第二个重组克隆的插入片段再分离出末端小片段筛选第三个重组克隆,如此重复,得到一个相邻的片段,等于在染色体上移了一步,故称之为染色体步移(Chromosome Walking)染色体步移技术(genome walking)是一种重要的分子生物学研究技术,使用这种技术可以有效获取与已知序列相邻的未知序列。 13.辐射杂种=含有另一种生物染色体片段的啮齿类细胞。经辐射处理的人体细胞染色 体被打断成长度不一的片段,X?射线辐射剂量越高,产生的片段越小。将辐射处理的人体细胞与仓鼠细胞融合产生辐射杂种。 14.作图试剂= mapping reagent,覆盖整条染色体或整个基因组的DNA片段群体,用于 STS作图。 15.锚定标记=用于衔接克隆重叠物理图与遗传图单一序列的分子标记。 16.物理图深度=物理图的任何一点上DNA片段的重复次数。深度与物理图的精确性直 接相关,深度越大,物理图的精确性就越高。 17.CpG岛= 基因组中富含GC(60%—70%)的DNA区段,一般长度为1—2kb。 18.染色体组= (chromosome set)不同真核生物核基因组均由一定数目的染色体组成, 单倍体细胞所含有的全套染色体。 19.序列复杂性=基因组中单拷贝的DNA序列称为单一序列,多拷贝的DNA序列称为重 复序列,不同序列的DNA总长称为复杂性(complexity)。

基因组学

基因组学概论 基因:合成有功能的蛋白质或RNA所必需的全部DNA序列,即一个基因不仅包括编码蛋白质或RNA的核酸序列,还应包括为保证转录所必需的调控序列。 基因组(genome):生物所具有的携带遗传信息的遗传物质的总和。 真核生物基因组 1 核基因组2线粒体基因组 3叶绿体基因组 原核生物基因组1染色体2质粒 基因组学(genomics):涉及基因组作图、测序和整个基因组功能分析的一门学科。分为:结构基因组学,功能基因组学和比较基因组学。 结构基因组学:通过基因组作图、核苷酸序列分析确定基因组成、基因定位的科学。 基因组作图:在长链DNA分子的不同位置寻找特征性的分子标记,绘制基因组图。根据分子标记可以准确无误地将已测序的DNA小片段锚定到染色体的位置上。 功能基因组学:利用结构基因组学,提供的信息和产物,在基因组系统,水平上全面分析基因功能的科学。研究内容 1 进一步识别基因以及基因转录调控信息。2 弄清所有基因产物的功能,这是目前基因组功能分析的主要层次。3研究基因的表达调控机制,研究基因在生物体发育过程以及代谢途径中的地位,分析基因、基因产物之间的相互作用关系,绘制基因调控网络图。 比较基因组学:研究不同物种之间在基因组结构和功能方面的亲源关系及其内在联系的学科。研究内容:1通过研究不同生物基因组结构和功能上的相似之处,不仅能勾画出一张详尽的系统进化树,而且将显示进化过程中最主要的变化所发生的时间及特点。据此可以追踪物种的起源和分支路径。2了解同源基因的功能。3对序列差异性的研究有助于认识产生大自然生物多样性的基础。 定位候选克隆通过遗传分析等方法将疾病基因定位到染色体区段上。对人类基因组图上该区段内的基因进行功能分析,并筛选出疾病基因。(多用于单基因遗传病的筛查) 单核苷酸多态性(SNP)是由于单个核苷酸改变而导致的核酸序列多态。SNP在人基因组中的发生频率比较高,是最常见的基因组差异。和人类的健康有着密切的关系。 SNP的实用价值:1 大多数SNP位于非编码序列,不影响基因功能。有些SNP位置靠近特定的基因,可作为基因的标志。其它的SNP位于编码序列内,可改变基因表达的蛋白质,从而影响人类健康。SNP类型还有助于发现疾病基因。2只在疾病患者上发现的SNP是疾病基因的标 记。 有的SNP在基因附近,通过SNP可发现疾病基因。 3 SNP类型还有助于发现患病的危险性。4通过 SNP地图,研究SNP与疾病易感性,治疗有效性 (药物反应性,抵抗性)等的关系。生活方式的 干预(吸烟,饮酒),适当疗法的选择。 镰刀形红细胞贫血症血红蛋白基因中单个碱基 的改变导致谷氨酸被缬氨酸取代。变异的血红蛋 白不能再携氧,导致疾病。 基因组 C值是指一个单倍体基因组中DNA的总量,一个 特定的种属具有特征的C值。不同生物基因组 DNA含量差异很大,如最小的原核生物支原体基 因组小于106 bp, 某些植物和两栖类基因组大于 1011 bp。 C值悖理:生物的复杂性与基因组的大小并不完 全成比例增加,在进化上鱼类和两栖类比哺乳类 低, 但其中有些鱼类和两栖类比哺乳类的C值为 高。哺乳类的C值在2-3 pg之间, 而两栖类的C 值在1到100 pg之间。这种看来有点反常的现象 称为C 值悖理,是复杂生物基因组的一个普遍特 征。 真核细胞DNA序列 一. 单一顺序(Unique sequence ) 二. 重复顺序 短片段的重复顺序可分为三种类型: (1)正向重复又叫顺向重复;(2)反向重复(3) 回文顺序 轻度重复顺序在基因组中含有2-10拷贝,酵母 tRNA基因、人和小鼠的珠蛋白基因等。如rRNA 和tRNA基因,tRNA基因一般都分布于基因组中, 而rRNA常集中分布于核仁形成区。 中度重复顺序长约300bp,基因组中约有10-几 千个拷贝的顺序,一般分散在基因组中。 高度重复顺序1卫星DNA 2小卫星3微卫星DNA 4重复序列可变数5DNA指纹 加工假基因(processed pseudogenes)。有以下 的特点⑴缺少正常的内含子;⑵3’末端有多聚 腺苷酸;⑶5’端的结构和mRNA的5’端十分相 似;⑷两侧有顺向重复顺序的存在。 遗传图绘制 鸟枪法不适合大而复杂的基因组! 克隆重叠群法(Clone contig) :首先用内切酶把待 测基因组降解为数百k b以上的片段,构建大分 子克隆重叠群覆盖的基因组物理图以及高密度 分子标记遗传图,并将二者整合绘制基因组整合 图,再分别测序组装。 靶标鸟枪法(directed shotgun):首先根据染色体上 已知基因和标记的位置来确定随机测序DNA片 段的相对位置,再逐步缩小各片段之间的缺口。 基因组测序的步骤:1构建基因组图2将基因分 解,逐个测序3绘制基因组图 人类基因组的四张图:遗传图;物理图;DNA序 列图;转录图; 遗传图谱:是以遗传距离表示基因组内基因座位 相对位置的图谱。遗传距离是通过遗传连锁分析 获得的,单位为厘摩(cM), 每单位厘摩定义为1% 交换率。 染色体标志:长臂、短臂、区、带、亚带等。但 是每一条染色体亚带通常包含几百万个碱基。 遗传图谱的作用是什么? 1 比较基因组研究 2 发现经济性状相关的基因3 发现导致主要生理缺陷的基因 4 用遗传标记辅 助选择育种 遗传作图:采用遗传学分析方法将基因或其它 DNA顺序标定在染色体上构建连锁图。 遗传作图标记(Genetic marker)指可识别的等位 基因。它具有两个基本特征,即可遗传性和可识 别性,因此生物的任何有差异表型的基因突变型 均可作为遗传标记。 遗传标记类型: 1. 基因标记a形态标记b细胞 学标记c生化标记2. DNA标记---分子标记 一、形态标记 优点:形态标记简单直观、经济方便; 缺点:数量很有限,多态性较差,表现易受环 境影响,并且有一些标记与不良性状连锁。 二、细胞学标记 即细胞染色体的变异:包括染色体核型(染色体 数目、结构、随体有无、着丝粒位置等)和带型 (C带、N带、G带等)的变化。优点:与形态 标记相比,细胞学标记的优点是能进行一些重要 基因的染色体或染色体区域定位。缺点:细胞学 标记材料需要花费较大的人力和较长时间来培 育,难度很大;某些物种对染色体变异反应敏感; 还有些变异难以用细胞学方法进行检测。 三、生化标记主要包括同工酶和等位酶标记。 同工酶是:指结构不同、功能相似的酶,也即具 有同一底物专一性的不同分子形式的酶。属于一 个以上基因座位编码的酶的不同形式; 等位酶是:指由一个基因座位的不同等位基因编 码的酶的不同分子形式。 分析方法是从组织的蛋白粗提物中通过电泳和 组织化学染色法将酶的多种形式转变成肉眼可 辩的酶谱带型。 优点:直接反映了基因产物差异,受环境影响较 小。 缺点:目前可使用的生化标记数量还相当有限, 且有些酶的染色方法和电泳技术有一定难度,因 此其实际应用受到一定限制。 ☆基因标记虽然非常有用,但并非理想的标记。 1)高等生物如脊椎动物和显花植物,可用作标 记的基因十分有限。许多性状都涉及多基因,很 难选择可用的标记基因。2)高等生物基因组中 存在大量的基因间隔区,纯粹用基因作为标记将 在遗传图中留下大片的无标记区段;3)只有部 分基因其等位基因成员可以通过常规实验予以 区分,因而产生的遗传图是不完整的;4)重要 性状由多基因控制;性状=遗传+环境…… DNA标记(分子标记) DNA 标记:一段DNA顺序,具有2个或多个不 同的可以区分的版本,即等位形式(多态性)。 优点:中性、共显性、多态性高、数量多、分布 均匀、不受环境影响;多基因影响的同一性状遗 传分析可以将一个数量性状分解为多个QTL (Quantitative traits loci),通过分析数量性状的 基因位点,估算每个QTL 的遗传效应及贡献率。 分子标记 (1)是以Southern杂交技术为核心的分子标记, (如RFLP),这类分子标记被称为第一代分子标 记。(2)是以PCR技术为核心的分子标记,(如 STS、RAPD、AFLP、SSR)等,这类分子标记被称 为第二代分子标记;(3)单核苷酸多态性(SNP) 标记被称为第三代分子标记。 (一)RFLP标记限制性片段长度多态性,是指 用某一种限制性内切酶来酶切不同个体的DNA 分子,内切酶的识别序列位点发生变异,即由限 制性酶切位点上碱基的插入、缺失、点突变、重 排所引起的。这种差异反映在酶切片段的长度和 数目上。主要包括以下基本步骤: DNA提取→用限制性内切酶酶切DNA→ 凝胶电泳分开DNA片段→DNA片段转移到滤膜 上→利用放射性标记的探针杂交显示特定的 DNA片段(Southern杂交)和结果分析。 特点A 无表型效应,RFLP标记的检测不受环境 条件和发育阶段的影响。B RFLP标记在等位基因 之间是共显性的,因此在配制杂交组合时不受杂 交方式的影响。C在非等位的RFLP标记之间不存 在上位效应,因而互不干扰D RFLP标记起源于基 因组DNA的自身变异,数量多。E 检测所需DNA 量大,检测技术繁杂,难以用于大规模的育种实 践中。在植物分子标记辅助育种中需要将RFLP 转换成以PCR为基础的标记。F 由于每个RFLP 只有两种等位形式(有或没有这个位点),这就 限制了RFLP在人类基因作图上的应用价值,因 为一个家庭中的所有成员很可能都是某个RFLP 的纯合子。

(整理)分子生物学总结

第一章基因与基因组 一、基因与基因组特点(重点) 1.Gene:a gene includes the entire nucleic acid sequence necessary for the expression of its product (peptide or RNA). 2.Genome(基因组):细胞内所携带的全部遗传信息DNA的总和。 3.C值(C-value): 单倍体DNA所包含的全部DNA量。 4.C值矛盾(C-value Paradox):物种的C值和它进化复杂性之间没有严格的对应关系。 5.真核生物基因组的特点: (1)基因组较大 (2)往往有很多染色体,多复制起始位点(ori) (3)DNA与蛋白质结合,形成核小体(nucleosome) ,再缠绕成染色质chromatin (染色体chromosome ) (4)转录和翻译在时间和空间上是分隔的。 (5)转录产物为单顺反子(mono-cistron) (6)有可移动的DNA序列 (7)有大量的重复序列、基因家族(gene family)、不连续基因(discontinuous gene) (真核生物基因组三大特点) 6.真核生物基因组的序列类型:高度重复序列、中度重复序列、单拷贝序列。 7.基因家族(gene family):基因组中来源相同、结构相似、功能相关的一组基因。 产生机理(理解):不对等交换、几种基因家族:Alu基因家族、rRNA基因家族、组蛋白基因家族、珠蛋白基因家族疾病:Thalassemia(地中海贫血) 8.珠蛋白基因家族α2β2,α型亚基基因在16号染色体上,β型亚基基因在11号染色体上,珠蛋白基因以基因家族的形式排列。 9.基因簇(gene cluster):同一家族中的成员有时紧密地排列在一起,成为一个基因簇。 10.假基因(pseudogene):具有与功能基因相似的序列, 却不具正常功能的基因。 11.不连续基因(discontinuous gene) 或断裂基因(split gene):基因的编码序列在DNA分子上是不连续的,为不编码的序列所隔开。 证据(理解):R环结构、限制性内切酶分析 12.外显子(Exon) :真核细胞基因DNA中的编码序列,这些序列被转录成RNA并进而翻译为蛋白质。 13.内含子(Intron) :真核细胞基因DNA中的非编码序列,这些序列被转录成RNA,但随即被剪切掉而不翻译。 14.外显子与内含子的连接区:(1)内含子的两端序列之间没有广泛的同源性 (2)类型II基因内含子两端有保守区,是RNA剪接的信号序列15.外显子与内含子的可变调控: 组成性剪接(constiutive splicing):一个基因的转录产物通过剪接只能产生一种成熟的mRNA。 选择性剪接(alternative splicing):同一基因的转录产物由于不同的剪接方式形成不同mRNA。 16.内含子的特点:并不是所有真核基因一定有内含子; 同一基因家族中,外显子在进化中一直比较保守,而内含子变化迅速,差异较大; 不同的基因内含子的数量和长度不同; 内含子与外显子间的连接处有特殊的序列; 一个基因的内含子可以是另一个基因的外显子。

基因组学

1 Structural genomics and function genomics 结构基因组学:经过基因作图、核苷酸分 析来确定基因的组成和基因定位。 功能基因组学:在结果基因组学所获得的 信息和产物的基础上,全面系统地分析基 因的功能。 2 orthologous and paralogous genes 直源基因:基因是那些不同种属生物间的 同源基因,它们的共同祖先早于种属分化。 旁源基因:基因存在于同种生物中,常识 多基因家族的成员,他们的祖先可能早于 或晚于种属分化。 4 Enhancer trap and promoter trap 增强子陷阱:将某报告基因与一个精巧的 启动子相连,组成一增强子陷阱重组体, 它不会自主起始转录,而需由被插入的细 胞基因组中的增强子帮助才可转录。若报 告基因最终表达,则可推知插入位点附件 有增强子或有基因,即实现了以增强子陷 阱重组体发现增强子的目的。 启动子陷阱:通过将报告基因插入到细胞 基因组的外显子上,一旦发现它与细胞基 因组基因共同转录或表达,则可知该报告 基因附件有启动子,从而起到了以之为诱 饵发现启动子的目的。 5 Ac/Ds transposon and T-DNA insertion T-DNA插入:农杆菌中细胞中分别含有Ti 质粒和Ri质粒,其上有一段T-DNA,农杆 菌通过侵染植物伤口进入细胞后,可将 T-DNA插入到植物基因组中。 Ac/Ds转座子:玉米中的一个转座子家族。 该家族的自主元件是Ac ,它包含和转座相 关的酶,能使Ac 、Ds 元件发生转座。而Ds 是一种非自主元件,它单独不能发生转座, 可以利用Ac 的转座酶发生转座。Ac/Ds 系 统的转座是通过剪切/粘贴的机制进行的。 请比较全基因组测序中克隆重叠群法 (clone by clone)和鸟枪法(shotgun method)测序的优缺点。 鸟枪法:将分子打成片段,得到每个片段 的序列,然后应用计算机搜索重叠区并构 建主序列。 优点:测序速度快,并且不需要遗传或物 理图谱。成本低,快速,易于自动化操作。 短期内完成大规模的基因组测序任务 缺点:从起始序列寻找重叠区域及构建序 列重叠群的复杂性和数据分析的限制。另 外,因为不连续的序列可能因为重复单位 而被错误连接在一起,所以要求所研究的 基因组中没有或只有很少的重复序列。主 要用于重复序列少、相对简单的原核生物 基因组,不适用于分析较大的、更复杂的 基因组。 克隆重叠群法:利用鸟枪法从基因组文库 中构建片段两端以测序的克隆文库(yac, bac,pac等)然后结合引物步查法和亚克 隆法进行克隆片段的测序,再将这些已测序 的克隆片段组装成整条染色体或整基因 组,它也是建立在鸟枪法构建重叠群的基 础上,结合引物步查法和亚克隆发进行更 精细的测序,适用于基因组全长序列的精 细测定, 优点:完成的序列质量高。 缺点。难以自动化分析,测序时间长。成 本高。 一、请叙述功能基因基因组学的研究 目标,以及完成这些目标的方法。 研究目标:在结构基因组学所获得的信息 和产物的基础上,全面、系统地分析基因 的功能。 方法:1、利用计算机分析基因功能 计算机预测基因功能的依据仍然是同源 性比较。根据同源性从数据库中查找已知 序列的同源基因。根据进化的相关性,和 已知的同源基因推测新基因的功能。 2、用实验分析确定基因功能 (一)DNA水平:T-DNA标签(失活标签、活化标签);基因、启动子、增强子陷阱; 转座子插入;TILING;自然突变等。 (二)RNA水平:反义RNA;RNAi;过 表达 基因失活是基因功能分析的主要手段 如果我们找到某种方法,使该基因在生物体内失活,就可以从反面鉴别该基因的功能。 基因剔除(knock-out) 将一段无关的DNA片段用来取代目标基因 是最简单的基因失活方法。如果该基因所控制的表型变化了,就从反面验证了目标基因的功能。 基因的超表达用于功能检测 让基因过量表达,也能用于基因的功能检测。有两种技术可以使细胞中某一基因过量表达:增加基因的拷贝数;采用强启动子。 反义RNA技术 反义RNA由基因的负链(模板链的互补链)编码,可以与由功能基因转录而成的正义RNA形成双链结构,干扰mRNA的翻译,从而干扰基因的表达。分析表达的反义RNA在生理生化或形态发生中所起的作用,由此判别目标基因的功能。 转座子插入突变 将转座子随机插入功能基因内,使其失活,也可以用于基因功能研究。 酵母菌双杂交系统 在酵母菌双杂交系统中,将编码这2个功能域的DNA分别构建在2个独立的表达载体上。在一个表达载体中,与DNA结合功能域的基因片段与待测蛋白质的基因连接成融合 基因。在另一个载体中,RNA聚合酶激活功能域的基因片段与未知的DNA序列连接成融合蛋白基因。将这2个表达载体同时转化一个细胞,并在细胞内表达,如果DNA结合功能域蛋白与同RNA聚合酶激活功能域蛋白之间能够互作,就会启动报告基因的表达。 二、请简述植物中同根(orthologous) 基因克隆的原理和方法。 原理:同源基因拥有一个共同的祖先基因, 它们之间有许多相似的序列。 从数据库中查找已知序列的同源基因,根 据已知的同源基因的序列设计引物,设计 引物时可加入一些酶切位点,方便以后的 克隆。通过PCR法扩增出目的片段,回收 纯化后将其导入T载体转入大肠杆菌,筛 选后就得到该基因的克隆。orthologs的生 物信息预测方法主要有两类:系统发生方 法和序列比对方法。这两类方法都是基于 序列的相似性,但又各有特点。系统发生方 法通过重建系统发生树来预测orthologs,因 此在概念上比较精确,但难于自动化,运算 量也很大。序列比对方法在概念上比较粗 糙,但简单实用,运算量相对较小,因此得到 了较广泛的应用。 三、在功能基因组学研究中,一项重要 的工作就是构建突变体库,请比较插入突 变(如他T-DNA,AC-DS插入,基因陷阱 等)方法和TILLING(Targeting induced local lesions in genomes)方法在实验的流 程上的异同,并比较它们在基因功能分析 上的优缺点。 相同点: 不同点:插入突变需要构建载体,需要转基因,而TILLING不需要这些。 插入突变优点: 插入突变缺点:1多拷贝时无法做2易引起染色体重排3方向容易插错4不能移动,需要的转化数多5插入效率低 TILING优点:不需要转基因,高通量、大规模、高灵敏度和自动化 缺点:有时基因有几个拷贝,若只突变一个,因为可能存在互补,所以看不出其变化;有时突变后因为密码子的简并行,也看不出其变化;有时突变后,蛋白质是发生了变化,但可能不影响其功能。 四、通过map-based cloning把目标基 因限定在1个20kb的区段内,请给出鉴定 该区段中是否存在候选基因的方法。 1.筛选与目标基因连锁的分子标记。利 用目标基因的近等基因系或分离群体分组 分析法(BSA)进行连锁分析,筛选出目 标基因所在局部区域的分子标记。 2.构建并筛选含有大插入片段的基因 组文库。用与目标基因连锁的分子标记为 探针筛选基因组文库,得到阳性克隆。 3.构建目的基因区域跨叠克隆群 (contig)。以阳性克隆的末端作为探针基 因组文库,并进行染色体步行,直到获得 具有目标基因两侧分子标记的大片段跨叠 群。 4.目的基因区域的精细作图。通过整合 已有的遗传图谱和寻找新的分子标记,提 高目的基因区域遗传图谱和物理图谱的密 谱的密度。 5.目的基因的精细定位和染色体登陆。 利用侧翼分子标记分析和混合样品作图精 确定位目的基因。接着以目标基因两侧的 分子标记为探针通过染色体登陆获得含目 标基因的阳性克隆。 6.外显子的分离、鉴定。阳性克隆中可 能含有多个候选基因。用筛选cDNA文库, 外显子捕捉和cDNA直选法等技术找到这 些候选基因,再进行共分离,时空表达特 点,同源性比较等分析确定目标基因。当 然,最直接的证明是进行功能互补实验。 五、请简述对一个已经克隆的目的基 因进行功能及信号传导途径研究的思路和 方法。 基因功能的研究可以有如下途径,1.研究基 因的时空表达模式,确定其在细胞学或发 育上的功能,例如,在不同细胞类型,不 同发育阶段,不同环境条件下一级病原菌 侵染过程中mrna,蛋白质表达差异,2, 研究基因在亚细胞内的定位和蛋白质的翻 译后调控等,3利用基因敲除技术进行功能 丧失分析或通过基因的过量表达(转基因) 进行功能获得分析,进而研究目的基因与 表型性状间的关系,4 通过比较研究自发 或诱导突变体与其野生型植株在特定环境 条件下基因表达的差异,另外,有些用于 基因分离的技术。如mrna差别显示,抑制 性扣除杂交技术等也可用于功能分析。技 术如northern 印迹,rt-pcr 基因芯片 酵母双杂交基本原理 酵母双杂交系统由Fields和Song等首先在研究真核基因转录调 控中建立 i 。典型的真核生长转录 因子,如GAL4、GCN4、等都含有二 个不同的结构域: DNA结合结构域 (DNA-binding domain)和转录激活结 构域(transcription-activating domain)。前者可识别DNA上的特异 序列,并使转录激活结构域定位于 所调节的基因的上游,转录激活结构域可同转录复合体的其他成分作用,启动它所调节的基因的转录。二个结构域不但可在其连接区适当 部位打开,仍具有各自的功能。而且不同两结构域可重建发挥转录激 活作用。酵母双杂交系统利用杂交基因通过激活报道基因的表达探测蛋 白-蛋白的相互作用。主要有二类载体: a 含DNA -binding domain的载体; b 含DNA-activating domain的载体。上述二类载体在构建融合基因时,测试蛋白基因与结构域基因必须在阅读框内融合。融合基因在报告株中表达,其表达产物只有定位于核内才能驱动报告基因的转录。 酵母双杂交系统的建立与发展是基 于对真核生物转录调控起始过程的 认识。真核生物中存在一种上游激活序列(upstream activating sequence, UAS),其作用是和激活蛋白结合并大大增加启动子的转录速度,从而在转录水平对靶基因表达进行调控。真核细胞转录起始需要反式转录激活因子的参与。很多真核生物的位点特异性转录激活因子是组件 式的,通常具有两个可分割开的结构域,即DNA特异性结合结构域(DNA-binding domain, BD)与转录激活结构域(transcriptional activation domain, AD)。这两个结构域即使分开时仍各具功能,互不影响。但一个完整的某个特定基因的转录激活因子必须同时含有这两个结 构域,否则无法完成激活功能。只有将这两部分通过适当的途径在空间 上接近才能恢复其激活转录的能力。不同来源的BD与AD结合后则特 异地激活BD结合基因的表达。基于这一特性,Fields等设计了一个检测蛋白质与蛋白质相互作用的系统。选择的转录激活因子是酵母细胞中的GAL4蛋白。分离GAL4蛋白N端的 1-147个氨基酸(BD)和C端的 768-881个氨基酸(AD),分别构建重组质粒。如果在BD上接上一个蛋白X,在AD上接一个蛋白Y,再将这二个质粒共同导入酵母菌中,若X,Y 蛋白在酵母内发生交互作用,则相当于将GAL4的BD和AD又连在一起,即可以转录激活下游报告基因的表达,通过测定报告基因的产物及活性来检测这种交互作用的发生。理论上,任何能在酵母中表达的基因均可作为报告基因,较为常用的是LacZ,和一些营养缺陷标记,这种报告基因只允许阳性克隆生长,最常用的是HIS3和LEU2。近来为了更灵敏、特异地筛选阳性克隆,常同时使用两种或两种以上的报告基因(如ADE2和URA3),一则它可以允许用比单纯颜色筛选更大的菌落密度铺板,从而获得较丰富的表达产物,二则双重筛选相互验证,可以排除一些假阳性结果;三则转化体制造了大量的融合蛋白以保证基因产物满足生长需要,结果LacZ转录提高,从而β-半乳糖苷酶的活性亦增强。

相关主题
相关文档
最新文档