基因芯片数据分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
芯片上大部分基因(假设芯片上大部分基因在不同 条件下表达量相同)
不同条件间稳定表达的基因(如持家基因) 控制序列(spiked control )
合成DNA序列或外源的DNA序列,在不同条件下 表达水平相同。
数据标准化
before
after
目的是消除系统偏差引起的高相关性,同时保留由真正生物 学原因引起的基因表达水平高相关性。
Microarray: 误差的来源
1. 图像分析
2. 扫描
3. DNA杂交过程 (温度、时间、混合均匀 程度等)
log signal intensity
4. 探针的标记
5. RNA的抽提 6. 加样
系统误差 随机误差
7. 其他
log RNA abundance
运用哪些基因进行标准化处理
2、样品的制备:生物样品往往是非常复杂的生物分子混 合体,除少数特殊样品外,一般不能直接与芯片反应。 可将样品进行处理,获取其中的蛋白质或DNA、RNA, 并且加以标记,以提高检测的灵敏度。
3、生物分子反应:生物分子反应为芯片上的生物分子之 间的反应,是芯片检测的关键一步。通过选择合适的反 应条件使生物分子间反应处于最佳状态中,减少生物分 子之间的错配率。
(2). DNA chips: 将寡核苷酸探针 (20~80-mer) 合成到 芯片上。Affymetrix开发设计,通常为单通道, 一次检验一种状态 。
(1) cDNA microarrays
cDNA clones
载玻片
来自百度文库
差异表达基因的筛选
Treatment / control Normal / tumor tissue Brain / liver …
高通量、点阵以及Northern杂交 同时测定细胞内数千个基因的表达情况 将mRNA反转录成cDNA与芯片上的探针杂交
芯片的体积非常小:微量样品的检测 基因表达情况的定量分析
生物芯片的基本要点
1、芯片方阵的构建:芯片制备是先将玻璃片或硅片进行 表面处理,然后使DNA片断或蛋白质分子等生物分子按 顺序排列在芯片上的过程。
基因芯片数据分析
1. 基因芯片(Microarray) 2. 图像处理与数据标准化 3. 基因芯片的数据分析
1. 基因芯片简介
基因芯片 (1987): 固定有寡核苷酸、DNA或cDNA等 的生物芯片。利用这类芯片与标记生物样品进行杂 交,可对样品基因表达谱生物信息进行快速定性和 定量分析。
荧光标记的靶基因
(2) DNA chips
DNA chips的制备:Affymetrix photolitography
探针长度:25 bp 每个基因:22-40个探针 Perfect Match (PM) vs.
MisMatch (MM) probes
A. 选择硅片、玻璃片、瓷片或聚丙烯膜、尼龙膜等支持物 B. 采用光导化学合成和照相平板印刷技术在硅片等表面合成寡核苷酸探 针; 或者通过液相化学合成寡核苷酸链探针,或PCR技术扩增基因序列, 由阵列复制器,或阵列机及电脑控制的机器人,将不同探针样品定量点 样于带正电荷的尼龙膜或硅片等相应位置上 C. 紫外线交联固定后即得到DNA微阵列或芯片
(1) 差异表达基因的分析
差异表达基因的分析: 寻找处理前后表达上调或 者下调的基因
三、基因芯片数据分析
1. 基因芯片(Microarray)简介 2. 图像处理与数据标准化 3. 基因芯片的数据分析
2. 图像处理与数据标准化
单通道基因芯片 white (very high) red (high) Yellow (a little high) green (medium) blue (low) black (no)
B. 按实验要求分类 1. 单通道 (Single Channel): 一次检验一种状态 2. 双通道 (Dual Channel): 差异表达基因的筛选
两类主流的DNA芯片
(1). cDNA microarrays: 将500~5,000bp的cDNA固载 到介质上 (例如玻璃)。Stanford开发设计,通常为 双通道,常用于差异表达基因的筛选。
fg = foreground, bg = background, and Green intensity = Gfg - Gbg
and combine them in the log (base 2) ratio Log2( Red intensity / Green intensity)
Green intensity (medium): ~1
三、基因芯片数据分析
1. 基因芯片(Microarray)简介 2. 图像处理与数据标准化 3. 基因芯片的数据分析
3. 基因芯片的数据分析
(1) 差异表达基因的分析 (2) 基因共表达分析 (3) 基因表达数据的聚类 (4) 基因表达数据的分类 (5) Map to GO (6) Gene regulatory network
图像处理
1. 栅格化:确定点的位置 2. 图象分割 (Segmentation):将点从背景中分离出来。 3. 抽提亮度:各个像素亮度的平均值 (mean)或中位数 (median) 4. 背景校正:局部或全局
植根区域生长法(SRG) Fixed Circle
基因表达量的定量
对于每个点,可以计算 Red intensity = Rfg - Rbg
4、信号检测:常用的芯片信号检测方法是将芯片置入芯 片扫描仪中,进行信号检测,以获得有关生物学信息。
基因芯片的密度:100-1 million DNA 探针/1cm2
碱基互补
将样品中的DNA/RNA标上荧 光标记,则可以定量检验基 因的表达水平
基因芯片技术的类型
A. 按技术手段、探针类型分类 1. Short oligonucleotide arrays (Affymetrix) 2. cDNA arrays (Brown/Botstein) 3. Long oligo arrays (Agilent) 4. Serial analysis of gene expression (SAGE)
不同条件间稳定表达的基因(如持家基因) 控制序列(spiked control )
合成DNA序列或外源的DNA序列,在不同条件下 表达水平相同。
数据标准化
before
after
目的是消除系统偏差引起的高相关性,同时保留由真正生物 学原因引起的基因表达水平高相关性。
Microarray: 误差的来源
1. 图像分析
2. 扫描
3. DNA杂交过程 (温度、时间、混合均匀 程度等)
log signal intensity
4. 探针的标记
5. RNA的抽提 6. 加样
系统误差 随机误差
7. 其他
log RNA abundance
运用哪些基因进行标准化处理
2、样品的制备:生物样品往往是非常复杂的生物分子混 合体,除少数特殊样品外,一般不能直接与芯片反应。 可将样品进行处理,获取其中的蛋白质或DNA、RNA, 并且加以标记,以提高检测的灵敏度。
3、生物分子反应:生物分子反应为芯片上的生物分子之 间的反应,是芯片检测的关键一步。通过选择合适的反 应条件使生物分子间反应处于最佳状态中,减少生物分 子之间的错配率。
(2). DNA chips: 将寡核苷酸探针 (20~80-mer) 合成到 芯片上。Affymetrix开发设计,通常为单通道, 一次检验一种状态 。
(1) cDNA microarrays
cDNA clones
载玻片
来自百度文库
差异表达基因的筛选
Treatment / control Normal / tumor tissue Brain / liver …
高通量、点阵以及Northern杂交 同时测定细胞内数千个基因的表达情况 将mRNA反转录成cDNA与芯片上的探针杂交
芯片的体积非常小:微量样品的检测 基因表达情况的定量分析
生物芯片的基本要点
1、芯片方阵的构建:芯片制备是先将玻璃片或硅片进行 表面处理,然后使DNA片断或蛋白质分子等生物分子按 顺序排列在芯片上的过程。
基因芯片数据分析
1. 基因芯片(Microarray) 2. 图像处理与数据标准化 3. 基因芯片的数据分析
1. 基因芯片简介
基因芯片 (1987): 固定有寡核苷酸、DNA或cDNA等 的生物芯片。利用这类芯片与标记生物样品进行杂 交,可对样品基因表达谱生物信息进行快速定性和 定量分析。
荧光标记的靶基因
(2) DNA chips
DNA chips的制备:Affymetrix photolitography
探针长度:25 bp 每个基因:22-40个探针 Perfect Match (PM) vs.
MisMatch (MM) probes
A. 选择硅片、玻璃片、瓷片或聚丙烯膜、尼龙膜等支持物 B. 采用光导化学合成和照相平板印刷技术在硅片等表面合成寡核苷酸探 针; 或者通过液相化学合成寡核苷酸链探针,或PCR技术扩增基因序列, 由阵列复制器,或阵列机及电脑控制的机器人,将不同探针样品定量点 样于带正电荷的尼龙膜或硅片等相应位置上 C. 紫外线交联固定后即得到DNA微阵列或芯片
(1) 差异表达基因的分析
差异表达基因的分析: 寻找处理前后表达上调或 者下调的基因
三、基因芯片数据分析
1. 基因芯片(Microarray)简介 2. 图像处理与数据标准化 3. 基因芯片的数据分析
2. 图像处理与数据标准化
单通道基因芯片 white (very high) red (high) Yellow (a little high) green (medium) blue (low) black (no)
B. 按实验要求分类 1. 单通道 (Single Channel): 一次检验一种状态 2. 双通道 (Dual Channel): 差异表达基因的筛选
两类主流的DNA芯片
(1). cDNA microarrays: 将500~5,000bp的cDNA固载 到介质上 (例如玻璃)。Stanford开发设计,通常为 双通道,常用于差异表达基因的筛选。
fg = foreground, bg = background, and Green intensity = Gfg - Gbg
and combine them in the log (base 2) ratio Log2( Red intensity / Green intensity)
Green intensity (medium): ~1
三、基因芯片数据分析
1. 基因芯片(Microarray)简介 2. 图像处理与数据标准化 3. 基因芯片的数据分析
3. 基因芯片的数据分析
(1) 差异表达基因的分析 (2) 基因共表达分析 (3) 基因表达数据的聚类 (4) 基因表达数据的分类 (5) Map to GO (6) Gene regulatory network
图像处理
1. 栅格化:确定点的位置 2. 图象分割 (Segmentation):将点从背景中分离出来。 3. 抽提亮度:各个像素亮度的平均值 (mean)或中位数 (median) 4. 背景校正:局部或全局
植根区域生长法(SRG) Fixed Circle
基因表达量的定量
对于每个点,可以计算 Red intensity = Rfg - Rbg
4、信号检测:常用的芯片信号检测方法是将芯片置入芯 片扫描仪中,进行信号检测,以获得有关生物学信息。
基因芯片的密度:100-1 million DNA 探针/1cm2
碱基互补
将样品中的DNA/RNA标上荧 光标记,则可以定量检验基 因的表达水平
基因芯片技术的类型
A. 按技术手段、探针类型分类 1. Short oligonucleotide arrays (Affymetrix) 2. cDNA arrays (Brown/Botstein) 3. Long oligo arrays (Agilent) 4. Serial analysis of gene expression (SAGE)