解读基因组序列页PPT文档

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

单核李氏杆菌溶血素gln基因
基因无内含子ORF连续
高等真核生物DNA的ORF扫描
高等真核生物基因之间间隔太大发现家ORF的概率 增加
高等真核生物基因内有内含子导致ORF不连续,外 显子小于100个密码子 因此高等真核生物基因不会以长ORF形式出现 在基因组序列中,ORF无法扫描
内含子使ORF扫描复杂化
依据某种生物体的DNA特征进行具体 分析:如脊椎动物基因组包含着许多基
因上游都有的CpG(CpG island)岛
功能性RNA定位基因
搜寻编码RNA二级结构的特征碱基序列 搜寻DNA编码茎环或发夹结构的程序 搜索与功能RNA基因相关的调控序列 搜寻紧凑的较小基因组中蛋白质编码基因
间的空位置
相关物种的相似基因组
用同线性比较检测短ORF真实性
自动标注基因组序列
计算机方法从序列分析开始,运用能扫 描ORF、外显子-内含子边界及上游调控区 并能在数据库中检测同源基因ORF的程序进 行序列分析。这些程序同时也用于寻找重 复序列及功能RNA基因的特意性特征,而后 信息整合分析。
5.1.2.基因定位的实验技术
河豚鱼AF164138序列某段基因分析 内含子的基因图
ORF扫描的三项改良
密码子偏倚:特定生物体的基因中并不是所有密 码子使用频率都相等,真正外显子有所偏倚。
外显子——内含子边界 :因为有特定的序列特征 而区分开
上游调控序列:调控序列有明显特点,可用来定 位基因起始区
外显子——内含子边界
5.2.1基因功能的计算机分析
同源性搜索是通过把被研究的DNA序列与数据库 中其他所有的DNA序列进行比较来定位基因。
同源性搜索的基础是相关的基因具有相似序列, 因此可以通过与不同物种中已测序的同源基因具 有相似性来发现新基因。
▲同源性反映出进化关系
同源基因具有共同的进化祖先,是通过基因之 间的序列相似性而发现的。(如图5.16) 同源基因分两类: ①定向进化同源基因orthologous gene 是那些不 同生物体间存在的同源物,它们的共同祖先早于物 种之间的分裂。同源基因通常具有相同的或很类似 的功能。Eg:人类和黑猩猩的肌红蛋白基因是同源 基因。
5 解读基因组序列
5.1在基因序列中定位基 因
基因测序的后续工作
弄清楚: 1.基因组顺序中所包含的全部遗传信息是什
么(查找基因) 2.基因组作为一个整体如何行使其功能
基因定位的两种常见方法:
其一,根据已知的序列人工判读或计算机 分析寻找与基因有关的序列(如:序列筛 查定位基因)
其二,实验研究,看其能否表达基因产物 及其对表型的影响,既实验分析
5.1.1通过序列筛查定位基因
细菌DNA的简单ORF扫描 高等真核生物DNA的ORF扫描 功能性RNA定位基因 同源性搜索和比较基因组学 自动标注基因组序列
基因可读框ORF
所有编码蛋白质的基因含有可读框(open reading frames ORF):是由可编码氨基酸 的密码子组成
大多数基因定位的试验方法依赖于检测 由基因转录成的RNA分子。 杂交试验可以判断某一片段是否含有转录 序列 cDNA测序有助于在DNA片段中进行基因作图 精确定位转录物末端 可以准确定位外显子——内含子边界
杂交实验判断转录序列
如果用标记的基因组片段与细胞RNA进行 northern杂交,就可以检测到那个片段上的基因 所转录出的RNA。缺点: 一些单个基因有两个或更多长度不等的转录物 mRNA表达时期和部位的特异性
图5.16 定向进化同源基因和平行进化同源基因
②平行进化同源基因paralogous gene 存在于相同 生物体中,常是可识别的多基因家族的成员,它们 共同的祖先可能早于或晚于目前发现新基因的物种 分裂。eg:人类肌红蛋白和β –球蛋白基因是平行基 因:它们起源于5.5亿年前祖先基因的复制。
印 迹 杂 交
northern
种 属 间 印 迹
cDNA测序有助DNA片段基因作图
将cDNA序列与基因组DNA序列相比较,就可 以描述相应基因的位置找到外显子——内含子的 边界,两个决定此方法成功的因素:
所研究基因DNA片段表达水平的高低
cDNA分子的完整性
合 成
cDNA
精确定位转录物末端
将RNA做起始材料进行特殊类型的PCR 逆转录PCR(reverse transcriptase PCR,RTPCR)快速扩增cDNA末端
其他的转录物准确作图的方法包括异源双链分析 (heteroduplex analysis)
准确定位外显子——内含子边界
外显子捕获(exon trapping):将一特殊类型 载体导入合适的真核细胞系中。根据已知的小基 因序列确定出插入的外显子其实和终止核苷酸的 位置,从而准确描述外显子
ORF起始于起始密码子(一般是ATG)终止 于终止密码子(TAA,TAG,TGA)
每个DNA序列有6种可读框
蛋白质编码基因是三联密码子的可读框
双链DNA分子具有6个可读框
寻找ORF(ORF scanning)
如果DNA序列CG碱基含量占50%则TAA,TAG,TGA每 一个将平均每64bp出现一次
tRNA
三 叶 草 结 构
一个大肠杆菌tRNA基因的序列
茎环结构
同源性搜索和比较基因组学
同源性搜索:查询DNA数据库来判断所检测序列是 否与已知基因的序列相同或者是相似
比较基因组学:当相关基因组进行比较时, Nhomakorabea源 基因由于它们的序列相似性很高就容易被鉴别出 来,而在第二个基因组中没有明确同源物的任何 ORF都可以很肯定的认为不是基因
如果GC含量大于50%那么含A和T碱基的终止密码子 出现的频率会相对比较少,但是预期每100— 200bp还会出现一次
寻找ORF的方式是将100个密码子作为一个基因长 度的下限
简单的ORF扫描细菌DNA
简单的ORF应用于细菌DNA序列的扫描 可以成功的定位大多数基因,因为细菌基 因间距非常小重叠基因较少,而且细菌基 因内无内含子,ORF连续。
外显子捕获
5.2 确定单个基因的功能
一旦一个新基因在基因组序列中获得定位,就 要探索它的功能问题。
大肠杆菌基因组序列中4288个蛋白质编码基因 中,以前已经鉴定出的基因只有1853个(占总数的 43%)。对于酿酒酵母,此数值只有30%。
像基因定位一样,也尝试着用计算机分析和实 验研究来确定未知基因的功能。
相关文档
最新文档