关联分析方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测样本是否来自于随机婚配人群 Assocation Correction
Observational p value
观测性P值,初步得出SNP是否与疾病 相关
针对关联分析中样本多重比较及数据 顺序问题,对p值进行矫正
Statistical Power
分析软件可采用,power and sample size, 1990 http://biostat.mc.vanderbilt.edu/PowerSampleSize
software:Haploview、SNPbrowser、PLINK SAS、SPSS etc
数据获得
分型方法
SNP分型 Genotyping 验证方法
质控体系 QC
核对
数据整理 Data Acquiring 从GENEID中调出临床资料
按照分析软件制作格式
统计推断
建立零假设 H0 :SNP与疾病不相关 建立备则假设H1 :SNP与疾病相关
Hardy-Weinberg Disequilibrium Test
HW主要运用Person chi-square思想,通过比较观察值和理论预测值的 分布,如果p〉0.05,表明原假设成立,样本来自一个随机婚配的群体,
反之,则不成立,样本不随机,不能用于关联分析
这里面要注意的是,HW检验针对的是群体,所以一般在case群体、对 照群体和总群体中都来检测p值,一般来说case群体不一定能通过HW检
进行数量性状分析是,可直接参考第一行回归方程,建立Linear Regression analysis,做矫正的时候将其它因素考虑进去,即可
Genetic Model Analysis
注意,Model Analysis 主要针对质量性状,才能做分析; 对于数量性状,可用ANOVA做方差分析,达到同样的分 析层次
质量性状 例如 CAD、AF、Stroke etc
检测统计量 采用Person chi-square test ,Fisher Exact test
数量性状 例如 BMI、lipid Blood Pressure etc 采用 regression analysis 或ANOVA方差分析
根据统计量大小以及相应自由度,求得 P值 P值反映了零假设成立概率,运用小概率法原理,p<0.05,即认为零假设 不成立,继而接受备则假设
相关计算概念
Statistical Power
Adjustment p value
统计效率检测,样本大小是否
对环境混淆危险因素进行调整后的p值
足够检测
Odds ratio
Hardy-Weinberg disequilibrium test 哈迪-温伯格不平衡检测,用于检
相对优势比,衡量风险等位基因的效 应大小
验,如果不通过,没关系
分析软件 以PLINK 为主,SPSS和EXCLE 都可以计算
质量性状关联分析
2*3 基因型统计表
2*2 等位基因统计表
列联表主要运用Person chi-square思想,通过比较观察值和理论预测值的 分布,如果p<0.05,表明原假设不成立,SNP与疾病相关,反之,则不成 立,该p值称为Observational p value,
质量性状关联分析
2*2 等位基因统计表
B为风险等位基因 Case 组 B等位基因 优势odds 800/400 Case 组 B等位基因 优势odds 400/1000 Odds Ratio=(800/400)/(400/1000)
=5.0
OR〉1 表明是一个危险因素; OR〈1 表明是一个保护性因素
95% CI of ln (OR) = ln(OR)±1.96(1/400 + 1/800 + 1/1000 + 1/400)0.5 95% CI of OR = e95% CI of ln (OR)
Adjustment p value
Mutlivaraient Logistic Regression Analysis 为了更加确认SNP与疾病关联程度, 我们必须要考虑会影响疾病状态的风 险因素,例如 性别和年龄: 偏回归系数〉0,表明是风险因素; 偏回归系数<0,表明是保护性因素; 偏回归系数=0,不具有相关性
Model analysis
plink --file filename --model (--cell 0) --out filename
SPSS
软件介绍 数据管理 数据操作
descriptive statistics Mutlivaraient Logistic Regression Analysis Linear Regression Analysis ANOVA
作图 pp plot qq plot
关联分析方法
Association Study Method
汪樊 2010-01-29 HUST-HGRC-GENEID
Index
SNP 相关概念 统计推断 关联分析常用术语及其计算方法
SNP
定义 definition 分类 classification 资源
web:Google、NCBI 、UCSC、HapMap Wikipedia etc
பைடு நூலகம்
PLINK files
PED
MAP
PLINK
自检 进入plink 目录
>>plink
HW p value
plink --file filename --hardy --out filename
Observational p value OR 95%CI
plink --file filename --assoc --ci 0.95--out fileanme