SNP芯片数据分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Affymetrix SNP芯片数据分析方案

项目一、基本分析

包括:

芯片原始数据的处理和基因分型,我们给出有统计意义的SNP列表。

描述性统计,如minor allele frequency,Hardy-Weinberg equilibrium等。

显著性检验,实验组与对照组的差异,假阳性率(FDR)的计算等。

SNP的关联分析,建立线性模型或logistic回归模型等。(所有的统计可以选择由SAS,SPSS,或S-Plus/R给出)

项目二、Copy Number Variation(CNV)的计算。

CNV是目前的一个热点研究内容。SNP芯片数据可以用于精确地计算CNV。我们提供针对SNP芯片的基于CNAG(Copy Number Analyser for GeneChip), dChip(DNA-Chip Analyzer)和CNAT(Chromosome Copy Number Analysis Tool)等算法的CNV计算结果。

项目三、SNP注释

通过SNP在染色体上的位置,利用寻找SNP可能影响的基因( or EST)。我们也可以对相应基因进行功能的注释(gene ontology ,pathway和转录因子分析等),进而解释SNP可能的作用机理。该部分可以参考常规表达谱芯片的分析。

项目四:基于模式识别的SNP挖掘

传统的SNP挖掘使用统计学的方法来进行,往往在敏感性与特异性上有一定的限制。利用一些模式识别/机器学习的方法可以更好解决SNP筛选问题。我们提供基于决策树等SNP挖掘算法。

Hsiang-Yu Yuan et al. FASTSNP: an always up-to-date and extendable service for SNP function analysis and prioritization. Nucleic Acids Research 2006 34(Web Server issue):W635-W641

项目五:诊断模型建立

利用筛选到的SNP建立人工神经网络(ANN)、SVM、PAML等诊断模型,在临床上具有重要意义。下图是我们使用ANN方法来构建诊断模型设计的策略:Array项目六、不同SNP平台整合分析

目前SNP public的数据越来越多,主要使用的是Illumina和affymetrix两个平台。我们提供

公共数据的整合分析的解决方案,包括不同平台数据之间的整合。

项目七、SNP芯片与表达谱芯片,aCGH等其他高通量数据整合

SNP与表达谱芯片,aCGH在技术上各有所长。我们提供数据整合方案实现综合所有可能的高通量方法,解决相应的生物学问题:如癌症药靶的筛选,复杂遗传疾病marker的挖掘等。

Stein Aerts et al. Gene prioritization through genomic data fusion. NA TURE BIOTECHNOLOGY VOLUME 24 NUMBER 5 MAY 2006

项目八、实验验证部分

包括数据验证实验设计,以及实验服务。

我们提供采用PCR方法,或taq-man的real-time PCR基因分型方法等对SNP芯片内容进行验证的服务。另外,我们也提供对SNP功能的后续实验服务,这包括:

1.对于位于基因启动子区域的SNP, 我们推荐对基因蛋白表达量进行检测(western blot)。

同时利用转录因子分析点突变对转录因子结合自由能的影响。

2.对于intron中的SNP,我们推荐进行可变剪切的验证(northern blot)。

3.对于CDS区域的SNP我们建议是否为同义突变,非同义突变可以利用3D你比较建模

分析蛋白结构的变化。

4.对于3’-UTR我们推荐进行microRNA结合位点预测和常见3’-UTR元件预测(如ARE

等)。突变会造成结合位点的丢失。

相关文档
最新文档