《功能基因组学》PPT课件
合集下载
功能基因组学课件
《功能基因组学》PPT课件
SAGE 步骤
1. 将5μg含有oligo dT(引物)的磁珠与 RNA混合。
2. 合成双链cDNA。
3. 用NlaⅢ酶消化形成一条链末端有标签 的产物。
4. 将样品分成两份,连接成含有识别序 列的产物,以备用BsmF1消化。
5. 用Mme I切割每一个样品形成约60bp 的标签。
➢ 科学研究已开始进入“后基因组时代”。主要是开展 功能基因组学和蛋白质组学的研究。
➢ 有科学家形象地说道:即使基因测序全部完成,也只 好像是一本没有姓名,只有号码的电话簿。“后基因 组时代”的最终目标,是要把深奥的DNA语言变成一 本大基因百科全书。
《功能基因组学》PPT课件
功能基因组学
功能基因组学,后基因组学(Post genomics): 利用结构基因组学提供的信息和产物 通过在基因组或系统水平上全面分析基因的 功能 生物学研究从对单一基因或蛋白质的研究转 向对多个基因或蛋白质同时进行系统的研究。
特定基因检测 突变检测 多态性分析 基因表达谱
• 生物信息学的工具 • 基因相关性研究 • 基因功能 • 药物设计和开发 • 潜在反义试剂开发 • 个体化医疗 • 身份识别 • 基因诊断 • 其他与生物有关的领域
《功能基因组学》PPT课件
例:肿瘤诊断
国外有一临床病人表现出典型的白血病症状,但形态 学检测不典型,根据相关检查,诊断为AML(acute myeloid leukaemia, 急性骨髓白血病),治疗几个月后未见 好转。后来用DNA芯片与病人骨髓的mRNA杂交,结果显示 AML和ALL(acute lymphoblastic leukaemia 急性成淋巴细胞白 血病)基因都表达较低,而在数据分析中发现,编码原肌球 蛋白的基因表达极高,从而确诊为肺泡弹状肌肉瘤,改变 治疗方案,病情出现缓解。
SAGE 步骤
1. 将5μg含有oligo dT(引物)的磁珠与 RNA混合。
2. 合成双链cDNA。
3. 用NlaⅢ酶消化形成一条链末端有标签 的产物。
4. 将样品分成两份,连接成含有识别序 列的产物,以备用BsmF1消化。
5. 用Mme I切割每一个样品形成约60bp 的标签。
➢ 科学研究已开始进入“后基因组时代”。主要是开展 功能基因组学和蛋白质组学的研究。
➢ 有科学家形象地说道:即使基因测序全部完成,也只 好像是一本没有姓名,只有号码的电话簿。“后基因 组时代”的最终目标,是要把深奥的DNA语言变成一 本大基因百科全书。
《功能基因组学》PPT课件
功能基因组学
功能基因组学,后基因组学(Post genomics): 利用结构基因组学提供的信息和产物 通过在基因组或系统水平上全面分析基因的 功能 生物学研究从对单一基因或蛋白质的研究转 向对多个基因或蛋白质同时进行系统的研究。
特定基因检测 突变检测 多态性分析 基因表达谱
• 生物信息学的工具 • 基因相关性研究 • 基因功能 • 药物设计和开发 • 潜在反义试剂开发 • 个体化医疗 • 身份识别 • 基因诊断 • 其他与生物有关的领域
《功能基因组学》PPT课件
例:肿瘤诊断
国外有一临床病人表现出典型的白血病症状,但形态 学检测不典型,根据相关检查,诊断为AML(acute myeloid leukaemia, 急性骨髓白血病),治疗几个月后未见 好转。后来用DNA芯片与病人骨髓的mRNA杂交,结果显示 AML和ALL(acute lymphoblastic leukaemia 急性成淋巴细胞白 血病)基因都表达较低,而在数据分析中发现,编码原肌球 蛋白的基因表达极高,从而确诊为肺泡弹状肌肉瘤,改变 治疗方案,病情出现缓解。
医学分子生物学-基因组ppt课件
结构基因:基因中编码RNA或蛋白质的DNA序列
调控序列:启动子/增强子/加尾信号
基因组(Genome)
细胞或生物体 一套完整单倍体的遗传物质的总和。
人
(Homo Sapien)
常染色体: 22 性染色体: X,Y
线粒体
n 基因组储存了生物体整套的遗传信息
n 不同生物基因组蕴含的遗传信息量有着巨大的 差别
反向重复序列 7.功能相关的基因构成各种基因家族(gene family) 8.存在可移动的遗传因素(mobile genetic element) 9.体细胞为双倍体,配子(精子/卵子)为单倍体
n (多)基因家族:指核苷酸序列或编码产物的结构具 有一定程度同源性的一组基因,它们功能相似。
n 基因超家族:一组由多基因家族及单基因组成的更大 的基因家族。它们的结构有程度不等的同源性,但功 能并不一定相同,甚至毫无相同之处。在进化上亲缘 关系较远。
Hairpin
5’
3’
小结构基因没有翻译起始序列
Splicing
DNA病毒 RNA过程
HBV 基因结构
原核生物基因组
模式生物: 大肠杆菌 (E.coli)
细菌的遗传物质
Genome DNA
plasmid
Transposable element
原核生物基因组结构与功能特点*
1、为一条环状双链DNA(无典型染色体结构,拟核) 2、只有一个复制起点(Ori) 3、具有操纵子结构V 4、重复序列少:绝大部分基因为单拷贝(99.7%) 5、可表达基因约50% ,>真核生物, <病毒
n 假基因:多基因家族中,某些成员并不能表达出有功 能的产物。与有功能的基因同源,但因突变等原因失 活,可能为进化的痕迹。
调控序列:启动子/增强子/加尾信号
基因组(Genome)
细胞或生物体 一套完整单倍体的遗传物质的总和。
人
(Homo Sapien)
常染色体: 22 性染色体: X,Y
线粒体
n 基因组储存了生物体整套的遗传信息
n 不同生物基因组蕴含的遗传信息量有着巨大的 差别
反向重复序列 7.功能相关的基因构成各种基因家族(gene family) 8.存在可移动的遗传因素(mobile genetic element) 9.体细胞为双倍体,配子(精子/卵子)为单倍体
n (多)基因家族:指核苷酸序列或编码产物的结构具 有一定程度同源性的一组基因,它们功能相似。
n 基因超家族:一组由多基因家族及单基因组成的更大 的基因家族。它们的结构有程度不等的同源性,但功 能并不一定相同,甚至毫无相同之处。在进化上亲缘 关系较远。
Hairpin
5’
3’
小结构基因没有翻译起始序列
Splicing
DNA病毒 RNA过程
HBV 基因结构
原核生物基因组
模式生物: 大肠杆菌 (E.coli)
细菌的遗传物质
Genome DNA
plasmid
Transposable element
原核生物基因组结构与功能特点*
1、为一条环状双链DNA(无典型染色体结构,拟核) 2、只有一个复制起点(Ori) 3、具有操纵子结构V 4、重复序列少:绝大部分基因为单拷贝(99.7%) 5、可表达基因约50% ,>真核生物, <病毒
n 假基因:多基因家族中,某些成员并不能表达出有功 能的产物。与有功能的基因同源,但因突变等原因失 活,可能为进化的痕迹。
功能基因组学
亲和层析
将目标蛋白固定在亲和层析介质上(如 Sepharose 4B),让细胞蛋白通过层析柱,与目标蛋 白结合的蛋白质被留在层析柱上,然后洗脱下来, 用质谱分析等方法进行鉴定。
免疫共沉淀 (co-immunoprecipitation,co-IP)
利用抗原和抗体间的反应特异性,用抗体将目 标蛋白以及与目标蛋白相互作用的蛋白质共同沉淀 下来的方法。
原位杂交
Northern印迹
DNA array/gene chip基因芯片
Real-time Quantitative PCR (qPCR,实时定量PCR)
PCR-Polymerase Chain Reaction
Plateau ar
Exponential
Taqman probe vs. SYBR Green dye
SDS聚丙烯酰胺凝胶电泳
二维 (Two dimensional) 凝胶电泳
等电聚焦电泳,利用等电点不同分离蛋白质。
(水平,X-轴)
SDS聚丙烯酰胺凝胶电泳:利用分子量大小不
同分离蛋白质。(垂直,Y-轴)
分 子 量 由 高 到 低
二 维 凝 胶 电 泳
等电点由低到高
质谱技术
质谱,顾名思义就是可以测量物质质量的
小结
转录水平:基因芯片,qPCR,原位杂交等
转录后调控:miRNA,siRNA
蛋白质水平:SDS-PAGE,2D,MS,免疫组化
蛋白质相互作用:Y2H,co-IP,SPR,FRET等
Please visit our website for more information.
聚丙烯酰胺凝胶电泳可以根据电荷和分子质量的差异来分 离蛋白质。 当阴离子去污剂十二烷基磺酸钠(sodium dodecyl sulfate, 简称SDS)与蛋白质结合后,蛋白质分子即带有大量的负
基因组学ppt课件
锁图。这一方法包括杂交实验,家系分析。遗传图距 单位为厘摩(cM), 每单位厘摩定义为1%交换率。
2)物理作图(Physical mapping) 采用分子生物学 技术直接将DNA分子标记、基因或克隆标定在基因组
实际位置。物理图的距离依作图方法而异,如辐射杂 种(radiation hybrid)作图的计算单位为厘镭(cR), 限 制性片段作图与克隆作图的图距为DNA的分子长度, 即碱基对(bp, kb)。
散的顺序按原来位置组装,需要图譜 进行指导. - 基因组存在大量重复顺序,会干扰排序, 因此要高密度基因组图.
2)由于一些分子标记同基因座位紧密连锁,为靶基因 的图位克隆(map based cloning)提供了可能。
3)遗传图和物理图各有优缺点,必须相互整合校正.
5
二、遗传图与物理图
1)遗传作图(Genetic mapping) 采用遗传学分析方 法将基因或其它DNA分子标记标定在染色体上构建连
由于同源染色体同一区段DNA序列的 差异,当用限制酶处理时,可产生 长度不同的限制性片段。
14
什么是RFLP标记?(2)
Var. A
Var. B
EcoR I will not cut this squence 15
什么是RFLP标记?(3)
16
(二) RFLP methodology
Cutting DNA into smaller fragments by restriction enzymes
2)生化特征表型。如人类血型系列分 析。
10
基因标记并非理想的标记,因为: - 可用作标记的基因十分有限。许多
性状都涉及多基因。 - 用基因做标记将在遗传图中留下大
片的无标记区段,因为存在大量的 基因间区。
2)物理作图(Physical mapping) 采用分子生物学 技术直接将DNA分子标记、基因或克隆标定在基因组
实际位置。物理图的距离依作图方法而异,如辐射杂 种(radiation hybrid)作图的计算单位为厘镭(cR), 限 制性片段作图与克隆作图的图距为DNA的分子长度, 即碱基对(bp, kb)。
散的顺序按原来位置组装,需要图譜 进行指导. - 基因组存在大量重复顺序,会干扰排序, 因此要高密度基因组图.
2)由于一些分子标记同基因座位紧密连锁,为靶基因 的图位克隆(map based cloning)提供了可能。
3)遗传图和物理图各有优缺点,必须相互整合校正.
5
二、遗传图与物理图
1)遗传作图(Genetic mapping) 采用遗传学分析方 法将基因或其它DNA分子标记标定在染色体上构建连
由于同源染色体同一区段DNA序列的 差异,当用限制酶处理时,可产生 长度不同的限制性片段。
14
什么是RFLP标记?(2)
Var. A
Var. B
EcoR I will not cut this squence 15
什么是RFLP标记?(3)
16
(二) RFLP methodology
Cutting DNA into smaller fragments by restriction enzymes
2)生化特征表型。如人类血型系列分 析。
10
基因标记并非理想的标记,因为: - 可用作标记的基因十分有限。许多
性状都涉及多基因。 - 用基因做标记将在遗传图中留下大
片的无标记区段,因为存在大量的 基因间区。
基因组学ppt课件
编辑课件
6
染色体带型命名
人类染色体带型最早确定的命名方式是从着丝粒向两侧按数字编号, 短臂以p代表 (p=petit),长臂以q代表. 短臂和长臂又可进一步分区,每个区又分为数个亚区, 亚区又可划分为不同的区带,有的区带又可细分为区亚带。
编辑课件
7
人类染色体核型
编辑课件
8
四、基因组的结构成分
1) SAR和MAR 2) CpG岛 3) 等高线
5) MAR或SAR之间的距离平均为30 kb, 染色体DNA环突
长约25-600 kb, 因此并非所有MAR或SAR均与基质或
骨架结合. 或这说MAR(或SAR)与基质或骨架结合的
位置是动态的, 不固定的.
编辑课件
11
SAR和MAR的应用
由于发现许多功能基因的两侧含有SAR或 MAR的结构,并证实SAR和MAR具有阻止 异染色质位置效应和隔离相邻基因彼此干 扰的功能, 因此为了提高转基因的表达水平, 在构建表达载体时可在基因两侧安装SAR 或MAR顺序, 以减少转基因沉默效应.
编辑课件
12
MAR
的 分 离
编辑课件
13
(2)什么是CpG岛
满足CpG岛的条件为: 1. 连续200 bp的DNA顺序(已修改为500 bp); 2. C+G含量大于50%(已修改为55%); 3. 观测到的CpG双碱基数目与预期的数目
之比大于0.6(已修改为0.65).
(Gardiner-Garden, J.Mol.Bio., 196:261, 1987; Proc Natl Acad Sci USA 99:3740-3745, 2002 )
第6章 真核生物基因组解剖
编辑课件
基因组学功能基因组学蛋白质组学
18
1、形态学标记
• 形态学标记(morphological marker)
能够用肉眼识别和观察、明确显示遗传多样性 的外观性状。
• 特点
简单直观,但标记数目少,多态性低,易受外 界条件的影响;
依据它进行选择的准确性差,所需时间较长, 选择效率Байду номын сангаас较低。
整理课件
19
2、细胞遗传标记
• 细胞遗传标记(cytological genetic marker)
基因组学 功能基因组学 蛋白质组学
整理课件
1
20世纪人类科技发展史上的三大创举
90年代人类基因组计划 60年代人类首次登上月球
40年代第一颗原子弹爆炸整理课件
2
人类基因组计划的启动
1986 年诺贝尔奖获得者R.Dulbecco
(杜尔贝科)提出人类基因组计划——
测出人类全套基因组的 DNA 碱基序列
8
人类基因组草图基本信息
人类基因组 人类蛋白质
• 由31.65亿bp组成 • 61%与果蝇同源 • 含3~3.5万基因 • 43%与线虫同源 • 与蛋白质合成有关 • 46%与酵母同源
的基因占2%
整理课件
9
基因组学(genomics):是阐明整 个基因的结构、结构与功能的关系 以及基因之间相互作用的科学。
• 生化遗传标记(biochemical genetic marker)
• 主要是指在同一动物个体中具有相同功能的蛋白质存在两 种以上的变异体。
整理课件
23
同工酶与等位酶
• 同工酶(isozyme):电泳所可区分的同一种 酶(系统)的不同变化
• 等位酶(allozyme):由一个位点的不同等位 基因编码的同种酶的不同类型,其功能相 同但氨基酸序列不同
基因组学第10章PPT课件
可调控常染色质区活性水平的一段顺式DNA成分.
2) LCR的功能:以顺式(cis-)方式调控与其 连锁的基因表达.
3) 第一个LCR首先在人类β-球蛋白基因座 位区发现.
见: Blood, 100:3077-3086, 2019
β
球蛋 白质 基因 座位 控制
区
β-球蛋白质基因座位控制区的结构
球蛋白基因簇含有5个功能基因,分别为ε、γG、γA、δ、β, 分布在50 kb的DNA区段。球蛋白基因只在血红细胞中表达,但每 个基因表达的时期与组织特异性各不相同。ε-球蛋白基因在胚胎卵 囊中表达,Gγ和A γ卵黄囊表达,δ和β仅在成体骨髓中表达。 尽管每个球蛋白基因都有一套彼此独立的调控系统,但它们都毫无 例外地受到位于该区上游一段长约12 kb的LCR控制. 5’HSs1-5是LCR区5个DNA-I酶高敏感位点,是处在开放状态的染色质 区.5’HSs1-4位点是类红细胞专一性的调控区, 5’HSs5-7为非类红细胞 活性. 增强子活性位于5’HSs2-3位点. human hispanic deletion为LCR区缺 失, 引起地中海贫血病. 卵圆型为气味受体基因区(olfactor receptor genes).
两种位置效应
美国学者E.B.刘易斯把位置效应分为两大 类型:稳定型和花斑型。 稳定型位置效应 简称S型位置效应,表型
改变是稳定的。 花斑型位置效应 简称V型效应,其表型改
变是不稳定的,从而导致显性和隐性 性状嵌合的花斑现象。
花斑型位置效应
当某一基因由 于染色体重排 从原来的常染 色质区移到异 染色质区附近, 因异染色质的 扩散效应, 造 成基因表达的 改变. 这种抑 制效应的差别 使基因表达受 抑程度不同, 由此产生嵌合.
2) LCR的功能:以顺式(cis-)方式调控与其 连锁的基因表达.
3) 第一个LCR首先在人类β-球蛋白基因座 位区发现.
见: Blood, 100:3077-3086, 2019
β
球蛋 白质 基因 座位 控制
区
β-球蛋白质基因座位控制区的结构
球蛋白基因簇含有5个功能基因,分别为ε、γG、γA、δ、β, 分布在50 kb的DNA区段。球蛋白基因只在血红细胞中表达,但每 个基因表达的时期与组织特异性各不相同。ε-球蛋白基因在胚胎卵 囊中表达,Gγ和A γ卵黄囊表达,δ和β仅在成体骨髓中表达。 尽管每个球蛋白基因都有一套彼此独立的调控系统,但它们都毫无 例外地受到位于该区上游一段长约12 kb的LCR控制. 5’HSs1-5是LCR区5个DNA-I酶高敏感位点,是处在开放状态的染色质 区.5’HSs1-4位点是类红细胞专一性的调控区, 5’HSs5-7为非类红细胞 活性. 增强子活性位于5’HSs2-3位点. human hispanic deletion为LCR区缺 失, 引起地中海贫血病. 卵圆型为气味受体基因区(olfactor receptor genes).
两种位置效应
美国学者E.B.刘易斯把位置效应分为两大 类型:稳定型和花斑型。 稳定型位置效应 简称S型位置效应,表型
改变是稳定的。 花斑型位置效应 简称V型效应,其表型改
变是不稳定的,从而导致显性和隐性 性状嵌合的花斑现象。
花斑型位置效应
当某一基因由 于染色体重排 从原来的常染 色质区移到异 染色质区附近, 因异染色质的 扩散效应, 造 成基因表达的 改变. 这种抑 制效应的差别 使基因表达受 抑程度不同, 由此产生嵌合.
功能基因组学
学检测不典型,根据相关检查,诊断为AML(acute
myeloid leukaemia, 急性骨髓白血病),治疗几个月后未见 好转。后来用DNA芯片与病人骨髓的mRNA杂交,结果显 示AML和ALL(acute lymphoblastic leukaemia 急性成淋巴细胞 白血病)基因都表达较低,而在数据分析中发现,编码原肌
球蛋白的基因表达极高,从而确诊为肺泡弹状肌肉瘤,改
变治疗方案,病情出现缓解。
RNAi(RNA interference,RNA干扰) 通过反义RNA与正链RNA形成双链RNA特 异性抑制靶基因的转录后表达的现象,存在于 从低等的线虫到人类培养细胞等多种有机体。 RNAi相关技术是研究转录后调控的有效工 具,可用于功能基因组学研究以及基因治疗等 临床用途。
DNA芯片的基本原理
基因芯片技术是建立在Southern blot基础之上的,可
以说它是Southern blot的改进和发展,它的原理是:
变性DNA加入探针后在一定温度下退火,同源片段之 间通过碱基互补形成双链杂交分子。
基因芯片基本操作流程
制备总RNA mRNA经RT-PCR用Cy3(正常对照组) 和Cy5(实验组)荧光标记目的基因,得到cDNA探针 混合标记探针 与表达谱芯片上核苷酸片 段(或基因)杂交 扫描 分析杂交结果 结论
库序列比较,可以提供内含子结构,可选择剪切方式,转录起
始和终止位点等信息。
EST的应用
分离和鉴定新基因
将所获得EST用生物信息学方法与公共数据库中的已 知序列比对,可以迅速准现有价 值的EST,可以找到对应的克隆,获得的全长cDNA可以直接 用于转基因等研究。利用EST方法进行发现、分离基因的
基因组学 课件 9.功能基因组学
• SAGE可用于在不同环境、不同生理状态及不同生长阶段 的细胞和组织表达图谱构建,对不同状态下基因表达水平 的定量或定性比较,特别是对疾病组织与正常组织的比较 发展迅速;
SAGE 技术的主要理论依据:
• 来自转录物内特定位置的一小段寡核苷酸序列 (9~11bp)含有鉴定一个转录物特异性的足够信 息,可作为区别转录物的标签(tag); • 通过简单的方法将这些标签串联在一起,形成大 量多联体(concatemer),对每个克隆到载体的多 联体进行测序,并应用SAGE软件分析,可确定表 达的基因种类,并可根据标签出现的频率确定基 因的表达丰度(abundance)。
基因产物———蛋白质功能的研究
• 蛋白质组学(proteomics) 在后基因组时代研究重心将从揭示生命的所有遗 传信息转移到整体水平上对功能的研究。 核心内容包括2个部分: 1. 蛋白质组研究体系的建立、完善 蛋白质组技术体系和蛋白质组信息学技术体 系包括:蛋白质样品制备和鉴定蛋白质相互作用 网络的研究技术等 2. 与重要的生物学问题有关的功能蛋白质组研究
功能基因组学简介
基因组DNA测序: 人类对自身基因组认识的第一步。 • 功能基因组学: 从基因组信息与外界环境相互作用的高度,阐 明基因组的功能。 • 功能基因组学的研究内容: –人类基因组 DNA 序列变异性研究 –基因组调控的研究 –模式生物体表达的研究 –生物信息学
功能基因组学的研究内容
• 基因的识别
• 估计基因的功能
• 基因功能的确定
基因的识别
预测基因组的全部编码区或称开放阅读框 架,目前基因组功能注释的一个主要方面。 一是评估未知DNA 片段编码可能性的概 率型方法,另一类是通过同源性比较搜寻蛋白 质库 / dbEST 库找寻编码区。 研究表明:鉴定和发现表达基因最快的途 径是确定cDNA 的部分序列,即EST ,这种序 列在大多数情况下已足够用于确认对应的基因。
《基因组学》PPT课件
第十章 基因组学 (Genomics)
ppt课件
1
Structural Genomics 结构基因组学 Functional Genomics 功能基因组学
Transcriptomics 转录物组学 Proteomics 蛋白质组学
ppt课件
2
第一节 真核生物基因组组成
Organization of Eukaryotic Genome
ppt课件
16
1. Genetic map 遗传图
The map in which mutant alleles or DNA markers are assigned relative positions along a chromosome on the basis of the recombination frequencies between them
Tetrahymena, GGGGTT Human, GGGATT Telomere-associated sequences: is repetitive and is found both adjacent to and within the telomere. The sequences vary among organisms.
ppt课件
5
Highly repetitive sequences 高度重复序列 5~300bp , 105 copies
Middle-repetitive sequences 中度重复序列 10~1000 copies
Unique sequences 单拷贝序列
ppt课件
6
▪ Gene family(基因家族): a set of genes in one genome all descended from the same ancestral gene.
ppt课件
1
Structural Genomics 结构基因组学 Functional Genomics 功能基因组学
Transcriptomics 转录物组学 Proteomics 蛋白质组学
ppt课件
2
第一节 真核生物基因组组成
Organization of Eukaryotic Genome
ppt课件
16
1. Genetic map 遗传图
The map in which mutant alleles or DNA markers are assigned relative positions along a chromosome on the basis of the recombination frequencies between them
Tetrahymena, GGGGTT Human, GGGATT Telomere-associated sequences: is repetitive and is found both adjacent to and within the telomere. The sequences vary among organisms.
ppt课件
5
Highly repetitive sequences 高度重复序列 5~300bp , 105 copies
Middle-repetitive sequences 中度重复序列 10~1000 copies
Unique sequences 单拷贝序列
ppt课件
6
▪ Gene family(基因家族): a set of genes in one genome all descended from the same ancestral gene.
基因组学.ppt1
James Watson
Francis Collins
• 1992年6月,Craig Venter离开国家卫生研 究院,建立了基因研究所(The Institute for GenomeResearch, TIGR),此后, TIGR从流感嗜血菌开始测了大量的细菌基 因组,流感嗜血菌也是第一个被测序的非 寄生物种
• Human genome project • Goal: characterize all human genetic material by • determining the complete sequence of the DNA in the • human genome. • HGP is accomplished by the joint effort between • U.S. Human Genome Project (HGP), composed of the • DOE (Department of Energy )and NIH (National • Institutes of Health), and Celera Genomics
• 1986年3月,1975年诺贝尔奖得主、Salk Institute的癌症研究员杜贝可(Renato Dulbecco)在“Science”期刊上发表文章,题 为“癌症研究的转折点:定出人类基因组序列”。 这片文章引起了美国社论。 • 杜贝可提出了两种基因搜寻路线,即以测序为核 心的“DNA”序列探测和以作图为中心的“基因 图位”克隆。
• 基因组学(Genomics):研究基因组及其基因的 科学。 • 最初是Thomas Roderick于1986年提出,其主 • 要内容是指基因组作图(Mapping)和测序 • (Sequencing)。 • 21世纪从生物体整体上研究生命现象 • 研究整个物种基因组碱基的组成、基因的结构、 • 基因在染色体上的分布,基因的时空表达和调控 • 网络。
基因组学数据分析 ppt课件
基因组学数据分析
本地数据库的构建
• 查看db文件
由fasta格式的序列组成
基因组学数据分析
数据库的格式化
formatdb命令用于数据库的格式化: formatdb [option1] [option2] [option3]…
formatdb常用参数 -i database_name 需要格式化的数据库名称 -p T\F 待格式化数据库的序列类型 (核苷酸选F;蛋白质选T;默认值为T)
➢ 四个必需参数 -p program_name,程序名,根据数据库及搜索文件序列性质进行选择; -d database_name,数据库名称,比对完成格式化的数据库; -i input_file,搜索文件名称; -o output_file,BLAST结果文件名称;
➢ 两个常用参数 -e expectation,期待值,默认值为10.0,可采用科学计数法来表示,如2e-5; -m alignment view options:比对显示选项,其具体的说明可以用以下的比对实例
基于距离矩阵upgmaunweightedpairgroupmethodusinganathematicaverage将类间距离定义为两个类成员距离的平均值广泛应用于距离矩阵njneighborjoining把所有n个序列两两比对构建nj树起指导作用每个对比后的成对序列都可以跟第三条序列或者另一个新的alignment比对按照距离远近用来决定下一个参与比对的序列73最大简约法mp不需要处理大量核苷酸或者氨基酸替代存在较多的回复突变或平行突变而被检验的序列位点数又比较少的时候可能会给出一个不合理的或者错误的进化树推导结果upgma所有分支突变率相近突变率相差较大时现已较少使用邻接法nj远源序列对相似度很低的序列往往出现longbranchattractionlba长枝吸引现象严重干扰进化树的构建
本地数据库的构建
• 查看db文件
由fasta格式的序列组成
基因组学数据分析
数据库的格式化
formatdb命令用于数据库的格式化: formatdb [option1] [option2] [option3]…
formatdb常用参数 -i database_name 需要格式化的数据库名称 -p T\F 待格式化数据库的序列类型 (核苷酸选F;蛋白质选T;默认值为T)
➢ 四个必需参数 -p program_name,程序名,根据数据库及搜索文件序列性质进行选择; -d database_name,数据库名称,比对完成格式化的数据库; -i input_file,搜索文件名称; -o output_file,BLAST结果文件名称;
➢ 两个常用参数 -e expectation,期待值,默认值为10.0,可采用科学计数法来表示,如2e-5; -m alignment view options:比对显示选项,其具体的说明可以用以下的比对实例
基于距离矩阵upgmaunweightedpairgroupmethodusinganathematicaverage将类间距离定义为两个类成员距离的平均值广泛应用于距离矩阵njneighborjoining把所有n个序列两两比对构建nj树起指导作用每个对比后的成对序列都可以跟第三条序列或者另一个新的alignment比对按照距离远近用来决定下一个参与比对的序列73最大简约法mp不需要处理大量核苷酸或者氨基酸替代存在较多的回复突变或平行突变而被检验的序列位点数又比较少的时候可能会给出一个不合理的或者错误的进化树推导结果upgma所有分支突变率相近突变率相差较大时现已较少使用邻接法nj远源序列对相似度很低的序列往往出现longbranchattractionlba长枝吸引现象严重干扰进化树的构建
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精选课件ppt
转录图的分析(Transcriptional map) 分离纯化mRNA或cDNA比较分析蛋白质的编
码能力,使人们有可能系统、全面地从mRNA 水平了解特定细胞、组织或器官的基因表达模 式,并解释其生理属性,深入认识细胞生长、 发育、分化、衰老和疾病发生的机制。
8
精选课件ppt
序列图分析(sequence map) 测定由30亿个核苷酸组成的全部序列。
10
精选课件ppt
功能基因组学
功能基因组学,后基因组学(Post genomics): 利用结构基因组学提供的信息和产物 通过在基因组或系统水平上全面分析基因的 功能 生物学研究从对单一基因或蛋白质的研究转 向对多个基因或蛋白质同时进行系统的研究。
功能基因组学的目的 基因功能发现 基因表达分析及突变检测 从基因组整体水平上对基因的活动规律进行 阐述。
功能基因组学
1
精选课件ppt
20世纪人类科技史上的三大创举
90年代人类基因组计划 60年代人类首次登上月球 40年代第一颗原子弹爆炸
2
精选课件ppt
一、基因组学概念及范畴
基因组(genome) 泛指一个有生命体、病毒或细胞器的全部
遗传物质;在真核生物,基因组是指一套染色 体(单倍体)DNA。
基因组学(genomics) 是指发展和应用DNA制图、测序新技术以
11
精选课件ppt
1、功能基因组学的研究内容 基因功能的研究 基因组的表达及时空调控的研究 蛋白质组及蛋白质组学的研究 基因组多样性的研究 模式生物体的基因组研究
12
精选课件ppt
2、功能基因组学的研究方法
单核苷酸多态性(SNPs)分析 表达序列标签(ESTs)分析 基因表达的序列分析(SAGE) DNA芯片 RNA干扰 蛋白质组学(双向电泳—质谱)
13
精选课件ppt
单核苷酸多态性(Single nucleotide polymorphism, SNP)
➢ 定义 单核苷酸多态性是指基因组DNA中某一特定核苷酸
位置发生了转换,颠换,缺失和插入等变化而引起的 序列多态性,而且任何一等位基因在群体中的频率不 小于1%。
➢ SNPs在GC序列上出现最为频繁,以C-T最多见。
➢遗传图的分析(Genetic map) 确定基因或DNA标记在染色体上的相对
位置与遗传距离
6
精选课件ppt
➢ 物理图的分析(Physical map) 以已知核苷酸序列的DNA片段(序列标
签位点)为路标,以碱基对作为基本测量单 位(图距)的基因组图。将各种标记直接定 位在基因库中的某个位点上。
7
人类基因组的核苷酸序列图其实是分子水平 上最高层次,最详尽的物理图。
9
精选课件ppt
二、后基因组学的研究(Postgenome era)
➢ 人类基因组计划完成之后,生物学被重新划分为前基 因组和后基因组两部分。
➢ 科学研究已开始进入“后基因组时代”。主要是开展 功能基因组学和蛋白质组学的研究。
➢ 有科学家形象地说道:即使基因测序全部完成,也只 好像是一本没有姓名,只有号码的电话簿。“后基因 组时代”的最终目标,是要把深奥的DNA语言变成一 本大基因百科全书。
24
精选课件ppt
25
精选课件ppt
EST的应用
构建遗传学图谱
遗传图谱、物理图谱和转录图谱,是基因组计划要获得 的3张遗传学图谱。构建染色体物理图谱需要大量的单拷 贝短序列作为界标,由于大多数基因是单拷贝的,所以可以用 EST序列充当序列标签位点(STS)。而且,由于EST序列是转录 基因的产物切方式,转录起始 和终止位点等信息。
外显子和内含子相连部位的SNPs可能改变外显子 一内含子的剪接,影响蛋白质的修饰;
在调控区域内的SNPs可以改变mRNA的表达水平和 稳定性。
17
精选课件ppt
以SNPs为基础研究人类疾病
➢ 遗传学家寻找致病基因的基本策略是:连锁分析和关 联分析。
➢ 连锁分析是确定两个遗传标记或者更多遗传标记 之间的物理关系,以确定致病基因的位置。
及计算机程序,分析生命体(包括人类)全部基 因组结构及功能。
3
精选课件ppt
基因组学包括3个不同的亚领域 结构基因组学(structural genomics) 功能基因组学(functional genomics) 比较基因组学(comparative genomics)
基因组学概念
4
精选课件ppt
小卫星序列:(Minisatellite DNA) 微卫星序列:(Microsatellite DNA, MS)
单核苷酸多态性标记(single nucleotide polymorphisms,SNP)
16
精选课件ppt
SNPs与表型
编码区内的SNPs可能改变氨基酸残基的种类,这 可以直接影响蛋白质的功能;
结构基因组学
• 结构基因组学(structural genomics)是通过人类 基因组计划HGP的实施来完成的。
• HGP的内容就是制作高分辨率的人类遗传图和 物理图,最终完成人类和其它重要模式生物全 部基因组DNA序列测定,因此HGP属于结构 基因组学范畴。
5
精选课件ppt
人类基因组计划(HGP)的研究内容
➢ 据估计SNPs在人类基因组的平均密度为1/1000,数量 巨大,因此多态性信息含量高。
14
精选课件ppt
15
精选课件ppt
DNA(分子)标记
限制性片段长度多态性(restriction fragment length
polymorphisms,RFLP)
简单序列长度多态性(simple sequenece length polymorphisrns,SSLPs)
➢ 关联分析是研究某种遗传标记与某一特定表型的之间 的关系
18
精选课件ppt
19
精选课件ppt
20
精选课件ppt
21
精选课件ppt
Байду номын сангаас
22
精选课件ppt
23
精选课件ppt
表达序列标签(Expressed sequence tags, ES端对插入的cDNA片段进行一轮单向自动测 序,所获得的约60-500bp的一段cDNA序列。