分子遗传学要点整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Chapter 1: Genomes, Transcriptomes and
Proteomes
1. 概述
基因组(Genome):指生物的整套染色体所含有的全部DNA或RNA 序列。基因组是地球上每一物种具有的生物学信息的存储库。
基因组学(Genomics):指研究生物的整个基因组,涉及基因组作图、测序和功能分析的一门学科。
基因组所包含的生物信息的利用需要酶及其他参与基因组表达过程中一系列复杂生化反应的蛋白质的协同活性。
基因组表达的最初产物是转录组,即那些含有细胞在特定时间所需生物信息、编码蛋白质的基因衍生而来的RNA分子的集合。转录组由转录过程来维持。
基因组表达的第二个产物是蛋白质组,即细胞中那些决定细胞能够进行生化反应的所有蛋白质组分。这是通过翻译过程来完成的。
2.1 Genes are made of DNA
奥地利神父孟德尔1865年根据7个碗豆性状的实验提出了遗传因子假说,认为每个性状由遗传因子控制,并提出了遗传因子的分离与自由组合两大遗传规律。
证明基因由核酸 (DNA或RNA) 组成的3个著名实验:
①肺炎双球菌的转化试验;DNA是遗传物质
②噬菌体感染实验;只有DNA是联系亲代和子代的物质
③烟草花叶病毒的感染实验。RNA也是遗传物质
2.2 The structure of DNA
A. Nucleotides and polynucleotides
B. The model of double helix
DNA 晶体X射线衍射图谱 为揭示DNA分子的二级结构提供了重要实验证据
a. Watson and Crick (1953) 提出的
DNA双螺旋结构模型:
" DNA分子通常以右手双螺旋形式存在,两条核苷酸链反向平行,且互为互补链。 " 戊糖-磷酸骨架在分子的外铡,在分子表面形成大沟和小沟,碱基堆积于螺旋内部。
" 碱基间通过氢键相互连接,A 和T 以2个氢键配对, G和C 以3个氢键配对。" 螺旋中相邻碱基间相隔0.34nm ,每10个碱基对螺旋上升一圈,螺距为
3.4nm ,直径为2.37 nm 。
b. DNA双螺旋结构的稳定力:
• 碱基间形成的氢键/ • 相邻碱基间的疏水堆积力/ • 碱基相互作用的范德华力
尽管氢键使得双链中的碱基间的配对具有特异性(只有互补的两条链之间才能形成DNA双链),但其对于双螺旋的总体上的稳定性并无太大贡献。
核酸分子的稳定性的根源在于碱基对之间的疏水堆积力。作为芳香族化合物,
碱基的平面使其不能在自由溶液中与水分子形成氢键,即它们是疏水的。疏水效应使双链DNA 成为能量上最为稳定的结构。尽管这种堆积作用在RNA 中也存在,但其在双链DNA中达到了最大化。
c. DNA双螺旋结构的类型:
三种形态的DNA :A-DNA, B-DNA, Z-DNA
两类:右手螺旋和左手螺旋
3. RNA and the Transcriptome
• 基因组表达的最初产物是转录组,即那些含有细胞在特定时间所需生物信息、编码蛋白质的基因衍生而来的RNA分子的集合。
• 转录组中的RNA分子以及其他来自非编码基因的RNA都由转录过程产生。
1. 稳定性差
2. 主要以单链形式存在
3.2 细胞内的RNA组分 (mRNA/ rRNA / tRNA)
核小RNA(SnRNA) :发现于真核生物细胞核中,与前体mRNA剪接成成熟mRNA 的过程相关。
核仁小RNA(snoRNA):发现于真核细胞核的核仁区,在rRNA分子的加工过程中起到核心作用(比如在某个核苷酸位点上加上一个甲基)。
微小RNA(miRNA)和短干扰RNA(siRNA):是调控个别基因表达的小RNA 。
3.3 Processing of precursor RNA
末端修饰 / 剪接 / 剪切/化学修饰
化学修饰在rRNA、tRNA和mRNA 中都存在;其中, mRNA 的化学修饰称作RNA 编辑。
3.4 The transcriptome
转录组虽然不到细胞总RNA 的4% ,却是细胞中最重要的组分,因为它包含了基因组表达的下一个阶段中所要使用的编码RNA 。
转录组从不从头合成(denovo),一个细胞通过细胞分裂诞生时就接收了其上一代的部分转录组,并维持一生。
各蛋白质编码基因的转录过程并不是导致转录组的合成,而是通过替换被降解的mRNA 来维持转录组,并通过开闭不同的基因的表达来改变转录组的组成。
3.5 转录组研究的方法
A. 通过序列分析研究转录组
1) RNA-seq
研究转录组最直接的方法是将其中的mRNA为cDNA ,并对所有cDNA 克隆进行测序,再与基因组序列进行比较分析。
这可以借助第二、三代测序技术进行。
2) 基因表达系列分析(Serial analysis of gene expression, SAGE)
SAGE技术不是研究完整的cDNA ,它产生长度12bp的短序列,每一条都代表了转录组中存在的一种mRNA 。
技术基础:412=16,777,216 bp ,真核mRNA平均1500 bp ,412相当于11,000个转录物,这比最复杂的转录组中存在转录物数目还多,因此12bp序列能够代表某一种mRNA 。
SAGE
切下来的片段被收集起来,头尾相连以产生一个串联体,进行测序分析。
串联体中的各个标签序列信息被读取并与基因组中的基因序列比对,从而可以分析哪些基因被转录,表达水平如何。
B. 通过微阵列或芯片分析来研究转录组
构成转录组的mRNA 总体被反转录成一个cDNA 的混合物,然后被标记,用于和芯片或微阵列杂交。
优点:可用于快速评估两个或多个转录组间的差异。
用不同的荧光来标记cDNA样品,微阵列与两个样品同时杂交,可以减少由于试验误差引起的差异。
4. Proteins and the Proteome
基因组表达的第二个产物是蛋白质组,即细胞中那些决定细胞能够进行生化反应的所有蛋白质组分。
这些蛋白质是通过翻译那些组成转录组的mRNA分子而合成的。
4.1 Protein structure
蛋白质和DNA分子一样,是一个线性的无分支的多聚体。
蛋白质中的单体亚单位称为氨基酸。
氨基酸形成的多聚体或多肽在长度上很少超过2000个单位。
a. primary structure氨基酸通过肽键连接成一条多肽链。
b. secondary structure指多肽采取的不同构象,由不同氨基酸之间形成的氢键所稳定。α螺旋;β片层
c. tertiary structure是将多肽链的二级结构组分折叠成为三维构型而形成的。
它被各种化学力所稳定:氨基酸残基间的氢键;带电荷的氨基酸R基团间的静电相互作用;疏水相互作用;半胱氨酸残基间的二硫键
d. quaternary structure两条或更多已形成三级结构的多肽链组合在一起形成一个多亚基蛋白质。
不是所有蛋白质都有四级结构;
稳定力包括:二硫键(稳定);氢键,疏水作用(松散)
X射线晶体学;核磁共振波谱学;三维电镜重构
B. 蛋白质的多样性取决于氨基酸的多样性
组成蛋白质的氨基酸在化学性质上有多样性,因此蛋白质的功能也是多种多样的。
氨基酸的多样性源于R基团。
非极性(疏水)极性(亲水)带负电荷带正电荷
4.2 The proteome
蛋白质组包括了在特定时间存在于细胞中的所有蛋白质。
A. The link between the transcriptome and the proteome
B. 蛋白质组和细胞生化功能之间的联系
基因组编码的生物学信息最终由蛋白质表现。蛋白质能够执行各种生物学功能:
生物催化作用(酶);