基因芯片及其应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Z值法
对于处在同一张芯片上的基因,一般我们认为只有小部分基因是有 表达差异(在对芯片原始数据做标准化的时候,我们也曾提到过这个假 设) ,同时信号比值在经过对数转换后,整张芯片上的基因比值近似于 正态分布。我们计算每个基因的 Z 值,Z=(X-µ)/ơ,其中,X 表示该基 因的表达比值,µ表示整张芯片上所有基因的比值平均数,ơ 表示整张 芯片上所有基因的方差。当 Z 值大于 2 或者-2时表示基因表达值在平均 比值加 2 倍方差以外,这样的差异就具有统计学意义,可以认为是差异 表达基因。 虽然 Z 值法可以帮助我们发现差异基因,但是它也有很大的缺点, 如果在给定的基因内不存在差异表达基因,当我们利用 Z 值方法来发掘 差异基因时,它总能给出 Z 值的绝对值大于或者小于 2 的基因,即增加 了假阳性率。同时,当我们关于“整张芯片中只有小部分基因是有表达 差异”的假设不成立,既有大量基因有表达差异的时候,Z 值法又会增 加假阴性率。
A A A A A
探针合成
A 3×3 array
CG AC G
AC ACG AG CG AG C
Nucleotide Deposition Sequence ACG
G
Mask 3
完成的芯片
CG AC G
AC ACG AG CG AG C
A A A A A
点样芯片
• 预先合成探针
Oligo探针 (GoArrays) PCR产物探针 (Primegens)
生物芯片及其应用
陈 欢 副研究员
Email:chenhuan7809@gmail.com QQ:20179430
什么是芯片?
内容
• 介绍目前主要的生物芯片类型 • 介绍表达谱芯片的实验过程
一、生物芯片的类型
• • • • • • • 表达谱芯片 CGH芯片 芯片测序 MicroRNA芯片 ChIP-chip ( ChIP-seq) 蛋白质芯片 组织芯片
wenku.baidu.com 重复实验的差异基因判别方法
差异基因的筛选(t-test)
C
D
E
小结
• 芯片数据处理,过程不是越复杂越好(因 为每一步处理都会带进新的误差); • 不要执迷于软件的选择(各式各样的软件 实在太多),选择通用的软件比较好 (Limma,TM4); • 不要过分执着于个别基因的情况,应该重 视一类基因表达的模式(pattern)情况。
聚类的实例
芯片实验往往会研究 一个动态的过程,如 药物处理的时间段, 药物处理的浓度梯度, 还有就是不同的方法 处理后的差异,等等。 右图--电离辐射后的细 菌(D.radiodurans出 现明显的生长停滞)
二、表达谱芯片介绍
• cDNA芯片的合成方法 • 样本的处理方法 • 数据分析方法简介
基因芯片的合成方法
• 原位合成芯片
光蚀刻原位合成法、电化学原位合成法、喷墨式 原位合成法
• 点样芯片
针点式合成法、喷墨式合成法
原位光刻合成基因芯片原理
光源 遮蔽板
芯片
探针合成
A 3×3 array
CG AC G AC ACG AG CG
MicroRNA 芯片
• MicroRNA芯片检测可用于发现样本间差异 表达MicroRNA,从而发现调控基因mRNA 转录后调控的关键因素。 样本间差异基因由mRNA是否翻译成蛋白质 以发挥功能,将受到差异MicroRNA的调控 影响。实验表型的差异将体现在差异基因 功能分布中,通过构建差异MicroRNA与差 异基因功能间的相互作用网络
高级数据处理
• Clustering and pattern detection(芯片研究 往往是一个动态的过程) • Discovery of common sequences in coregulated genes • Linkage between gene expression data and gene sequence/function/metabolic pathways databases
简单的数据分析主要步骤
• 数值提取 • 归一化 • 差异基因筛选
数据读取(Genepix Pro)
数据框获取: 1、人工获取; 2、Gal文件获取
Flag=-50 Flag=-100
Genepix Pro一些直观数据
背景数据的获取
• 局部法
This region has a diameter that is three times the diameter of the corresponding featureindicator 2个像素
2、标记
3、杂交 (预杂交)
4、洗片
5、扫描
图像扫描
Cy5
Cy3
D.radiodurans 全基因组芯片
D.radiodurans whole genome microarray
建议
1、如可取小量修饰好的玻片进行点样并测试整 个后处理和杂交过程。 2、一旦玻片点样后,应对小量点样玻片进行后 处理,后处理是否成功可用已知应产生良好结果 的 RNA制备的探针进行测试来判定。 3、所有阵列在杂交前应扫描一次,弃去那些有 明显污点的玻片,并弃去那些杂交前背景就高的 阵列。
其他的信号点
背景取值区
• 全局法
the global background values are either calculated from a mean or median of all local values
• 阴性对照法
Negative controls are features that are known not to be reactive, so that they can relied upon always to give the same intensity values independent of the experiment
金黄色葡萄球菌不同菌株的致病基因的组合
芯片测序
基因芯片的测序原理是杂交测 序,即通过与一组已知序列的 核苷酸探针进行杂交完成核苷 酸 序列 测定。用图说明测序 原理。在一块基片表面固定已 知序列的八核苷酸探针,当溶 液中带 有荧光标记的核苷酸序 列TATGCAATCTAG与基因芯 片上对应位置的核酸探针产生 互补杂交时, 通过确定荧光强 度最强的探针位置,获得一组 序列完全互补的探针序列,据 此可重组出靶核 苷酸待测序列。 DNA芯片测序技术包括芯片制 备、样品制备、分子杂交、检 测分析、序列 分析和组装等过 程。 (Solid测序-35bp)
实验流程
1、小分子量的RNA 提取; 2、加Poly(A)尾巴; 3、利用Oligo(dT)的 连接作用加入荧光; 4、杂交; 5、图像,数据获取。
ChIP-chip(ChIP-seq)
ChIP-chip的基本原理是在生理状 态下把胞内蛋白质和DNA甲醛作用 下交联在一起,用超声波打碎为 0.2-2 kb的染色体小片段,然后通 过目的蛋白质特异性抗体沉淀此复 合物,获得特异地作用于目的蛋白 结合的DNA片段,通过对目的片段 的纯化与检测,从而获得蛋白质与 DNA相互作用的信息。其中共沉淀 的 DNA和合适的对照用荧光标记, 加在载玻片上,用于芯片分析。使 用外源性DNA作为背景,免疫沉淀 DNA与作为背景的对照进行比较, 可以找到特异性蛋白在基因组中的 结合位点。
Lowess
A=1/2Log2RG M=Log2R/G
归一化的类型
• With-in slide normalization
globe normalization
print-tip normalization
• Between slides normalization
Globe normalization
即:Ratio=3/2 或者 Ratio<1/2则认为有差异
CGH芯片的应用(2)-产前诊断
• Affymetrix公司的GeneChip®aCGH芯片Cytogenetics Whole-Genome 2.7M)。采用高密度的芯片制备技术, 通过改进的长探针合成技术(约49mer),覆盖全基因 组约270万个标记,其中包括约40万个SNP位点,在高 分辨率下实现对人类基因组的检测。该技术可发现微小 缺失和扩增,还可以检测染色体中性杂合性缺失(copy neutral LOH)、单亲二体病(UPD)及嵌合现象。 • Agilent 2x105K芯片:每个芯片包含105,000个探针, Agilent的60 mer高精确度优化探针,提供了灵敏而精确 的拷贝数检测。芯片的设计针对有高置信度CNV区域, 从而能用较少的数据点获得极高的检出率。
• Illumina的CNV/LOH研究芯片适用于杂合性缺失(LOH) 和CNV的分析。
CGH芯片的应用(3)
微生物进化及功能分析中的应用:
原理:根据已经测序的参考基因组(reference genome)的基因来设计探针,和待测菌株的基因组 DNA杂交,就可以检测出该菌株基因组是否含有某基 因。并且可以根据菌株间基因的相似度来反映其进化 关系,也就是说两个菌株共享的基因越多,则两个菌 株亲缘关系越近。 优点:方便快捷准确 ;避免了同一物种的重复测序, 能够节省大量的时间和经费
Nucleotide Deposition Sequence ACG
AG
C
array probes
A
Mask 1
A A A
A
A
探针合成
A 3×3 array
CG AC G AC ACG AG CG
Nucleotide Deposition Sequence ACG
AG
C
array probes
C
Mask 2
芯片测序的特点
• 优点;陕速、成本低、易于自动化。 • 缺点:第一,由于众多寡核苷酸的组成各不相同, 其最佳杂交条件难于统一,易出现假阳性和假阴 性的杂交结果;第二,根据获得的数据无法准确 地排列重叠序列;第三,如果检测核酸存在重复 序列,那么重叠的探针不是唯一的,重组探针无 法再继续。所以,这种方法不能用于含有许多内 部重复和简单序列单元的DNA。但这种方法用于 再测序,即确认已知的核酸序列和研究单核苷酸 多态性(SNP)的检测或突变具有其他方法不可比 拟的优越性。突变分析、疾病分子诊断、基因分 型。
点制过程
点片后检查
样本的处理方法
• 按照样本分
DNA、RNA、DNA-蛋白复合体
• 按照标记信号分子划分
荧光燃料、生物素、放射性元素
• 按照标记方法分
cDNA 直接标记(间接标记)、PCR扩增标记、末端 标记
Cy3和Cy5
Cy3激发波长532nm
Cy5激发波长635nm
芯片实验流程
1、分离RNA(10µg)
芯片背景
为什么要归一化?
• 由于样本差异、荧光标记效率和检出率 的不平衡,需对cy3和cy5的原始提取信 号进行均衡和修正才能进一步分析实验 数据,Normalization正是基于此种目的。
归一化的方法
• 一组内参照基因(如一组看家基因,外参基 因)校正Microarray所有的基因、阳性基因、 阴性基因、单个基因。 • Lowess
核酸水平
非核酸水平
CGH芯片工作原理
CGH芯片应用(1)
精确、定量地研究人 类基因组微缺失和微 扩增及其定位方面的 应用,如肿瘤诊断, 发育方面研究的应用。
基因组差异的发现
在双倍体生物中(假设Ratio=Cy5/Cy3, Cy5标 记实验基因组,Cy3标记正常基因组)
log2Ratio>0.58 或者 log2Ratio<-1则认为有差异
• 点制芯片
预先合成好的探针通过类似于喷墨打印机的技术 喷射到玻璃基片表面,或者用针头点在片基上。
芯片探针的设计
• PCR产物设计软件(Primegens)
http://compbio.ornl.gov/structure/primegens/
• Oligo芯片设计软件 (GoArrays)
http://www.isima.fr/bioinfo/goarrays/
Print-tip normalization
Between slides normalization
差异基因筛选
• 原理:采用cy3/cy5的ratio值对差异基因进 行判断,或采用统计方法对差异基因进行 统计推断。 方法:倍数法:cy3/cy5比值大于2或者小于 0.5 • Z值法: Z=(X-μ)/σ 作用:发现两个样本间的差异表达基因, 便于后续分析。