QTL定位的原理和方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• RIL的产生慢而困难。
19:27
深度杂交系(Advanced intercross lines AIL)
• AIL开始于F2群体,杂交后裔继续杂交一定数目 的世代(与RIL近似,但是远交,而不是近交);
• AIL是在F2群体QTL定位的基础上进一步提高QTL 的定位精度;
• 对表型和标记基因型数据进行随机重排,它消除 了标记基因型和表型之间的关联;
• 每次重排数据,都要重新在整个基因组中进行 QTL定位分析;
• 通过多次重排,可获得每次检验LRT统计量在没 有QTL的零假设条件下的分布;
19:27
• Permutation test的具体步骤:
19:27
FDR(false discovery rate)
19:27
完全连锁标记统计能力的计算
• 近交系杂交情形下的QTL定位检测能力计算基于 单标记的t-检验和F-检验。
19:27
• F2设计:
• BC设计:
tBC (a d)
4
2 e
n
n

4
t2 2
e BC
(a d)2
19:27
• 对于合理的样本大小和小的QTL效应,要求的 t 值 为:
LS和ML的比较
• LS只使用了标记平均值信息,标记基因型组内的 方差变异没有被使用;而ML使用了所有可能的信 息,这包括标记基因型和性状分布。
• LS的计算比较简单易行,能够使用标准的软件 (SAS)进行分析;而ML计算非常困难,需要专 门的软件将其扩展到非常复杂的模型。
19:27
• 似然率检验和F检验的比较: – 对一个QTL,如果残差呈正态分布,则LS和 ML估计是相同的; – 对一般情形,关系变为:
• 该方法原则上能够区分QTL的效应和位置; • 该方法需要一张带有一定数目的遗传图谱,相邻
标记间的距离是已知的。
19:27
Haldane作图函数
r 1 e2M 2
• M为遗传距离(1M 100cM);
• 假设减数分裂期间的遗传物质交换沿着染色体是 随机和独立发生的。
19:27
QTL
19:27
d a
Sample size BC
672
128
42
11
6
19:27
• BC和F2设计的合理样本大小之比为:
– BC比F2的基因组扫描所需的显著性阈值要低;
BC:
F2:

BC比F2的

2 e
可能要低。
19:27
• 考虑两种设计阈值的变化:
19:27
19:27
• 如果连锁不完全(r 0),且使用单标记分析: • 如果连锁不完全(r 0),且使用区间定位分析:
– 1 LOD下降对应97%的QTL置信区间;
– 2 LOD下降对应99.8%的QTL置信区间;
19:27
19:27
Bootstrap置信区间
1. 对于一个大小为 n的群体,抽取 n个带有覆盖性
质的记录(有些记录被抽取多次,而有些记录 没被抽取);
2. 分析并估计QTL位置;
3. 重复上面的1和2两个过程,如200次或更多;
4. 在分布的两尾去掉2.5%的极端的QTL位置估计 值;
5. 剩余的95%表示置信区间的估计值。
19:27
QTL位置估计的置信区间
19:27
预测置信区间
• 置信区间的长度受样本大小、QTL效应和标记密 度的影响,对一个高密度标记图谱,Darvasi and Soller (1997)给出了一个预测的近似95%的置信 区间(单位cM):
19:27
Fine Mapping Strategies
Genomewide-based strategies:
Large scale BC, F2, half sibs, etc. Recombinant inbred lines (RIL) Advanced Intercross Lines (AIL)
• 方法
– Sort p values of all marker interval based on ascending order

19:27
LOD下降支撑区间(LOD drop support interval)
• 如果某一特定位置检测到一个QTL,需要对QTL所 在的位置执行检验;
• 零假设是该QTL位于估计的峰值位置,备择假设为
Impact of alpha
P(T) Critical value
19:27


T
Impact of effect size, N
P(T) Critical value
19:27

T
影响检测能力的重要因素
• 群体类型; • 样本大小; • QTL效应; • 基因组大小; • 标记密度; • 显著性阈值; • 分析类型。
19:27
完全连锁标记统计能力的计算理论
• Ⅰ型错误():当零假设为真,拒绝零假设所
犯错误的概率;
• Ⅱ型错误 ( ):当零假设为假,接受零假设所
犯错误的概率; • 统计能力被定义为:
19:27
Statistical errors
P(T) Critical value
H0
HA
19:27


T
• Such as BC and F2 design
19:27
单标记分析
19:27
• m是总平均;a 和 d 是加性和显性效应; r 是标记
和QTL之间的重组率。
• Pr(Qq Aa)是给定个体标记位点基因型为Aa的条
件下的QTL基因型Qq的条件概率;
• Pr(QqAa) 是标记和QTL基因型的联合概率; •19:27Pr( Aa) 是标记基因型的边际概率。
最大似然法分析
• 前面回交例子的似然函数为:
• Q j为QTL位点的基因型; • Ai 和 Bi 为个体 i在标记位点A和B的基因型; • N 为回交个体数。
19:27
• 似然率检验(LRT):
– Lreduced为零假设没有分离QTL条件下的似然值; – Lfull 为有一个QTL分离条件下的似然值。
• 大部分QTL定位分析结果显示LS获得与ML极端近 似的结果。
19:27
基因组扫描
• 区间定位的优势在于能对整个标记的基因组进行 扫描;
• QTL定位是在整个基因组内进行,某一个区间内 QTL基因型的条件概率根据侧翼标记信息进行计 算,然后一个区间接着一个区间,使用最小二乘 或最大似然法进行分析,同时每个区间的检验统 计量(F-ratio或LRT)也被计算,具有最大检验 统计量的位置就是QTL最可能存在的位置,而该 位置的QTL效应就是最好的QTL估计效应。
– n为样本大小; – a 和 d 为标准的加性和显性效应(以基因型标
19:27 准差为单位)。
统计能力(Statistical power)
19:27
为什么要计算检测能力?
• 给定样本大小,计算能够检测到的QTL效应; • 给定QTL效应,估计检测到该QTL需要的群体大
小; • 检测特定的QTL时,比较不同的群体设计。
• 对于所有的QTL定位设计,标记等位基因和QTL 等位基因之间的LD是必须的。
19:27
• QTL定位的关键
19:27
பைடு நூலகம் 19:27
19:27
第一节 LA定位(连锁分析定位)
19:27
linkage analysis
• only considers the linkage disequilibrium that exists within families, which can extend for 10s of cM, and is broken down by recombination after only a few generations.
• LOD检验:
19:27
最小二乘分析
• 前面回交例子的最小二乘分析模型为:
– 需要估计的参数:一种为两个QTL基因型的平 均值;另外一种为总平均值和两个基因型之间 的效应差;
• 显著性检验:
F MSQ RMS
– MSQ为拟合模型由QTL基因型解释的方差; – 19:27 RMS为拟合模型的残余均方。
第三章 QTL定位的原理和方法
19:27
19:27
QTL是什么?
• 数量性状位点(QTL)是影响数量性状的一个染 色体片段;
• QTL定位是确定数量性状基因在染色体上位置的 一种方法;
• QTL 和QTLs。
19:27
为什么要定位它?
• 它为了解个体数量性状基因之间的行为和交互作用等基础 知识提供了一条路径,允许建立更加真实的表型变异、选 择反应和进化过程模型;
• 将标记信息综合到遗传评估中,辅助人工选择程序,主要 方式有MAS和MAI;
• 能进行基因的位置克隆,允许对当前存在的数量变异进行 分子机制的研究,并通过直接的分子干预,进一步增加增 效等位基因频率。
19:27
QTL定位的基本原则
• QTL定位的基本原则是关联度量的遗传变异和表 型变异;
• 群体的选择、用于度量表型个体选择和基因型判 型个体的选择是所有QTL定位设计要重点考虑的 因素;
19:27
重组近交系(Recombinant inbred lines RIL)
• 重组近交系来源于F2群体的近交;
• RIL只需要被判型一次,却能很好地度量多个性状
(clonal Lines);
• RIL关键的特性是比F2发生更多的重组,数量性 状通过使用系平均值能被准确度量;
• RIL只能定位加性QTL;
来自近交系的回交群体的标记和 QTL概率
• 标记基因型之间的表型值平均差异:
19:27
单标记分析的缺点
• 单标记使用标记平均值,不能获得QTL效应单独 的估计值和QTL与标记的重组频率;因此,不能 区分是一个大的QTL效应松散地与标记连锁,或 是小效应紧密地与标记连锁。
19:27
区间定位
• Lander and Botstein (1989)提出使用所有连续的 标记进行QTL定位的方法;
19:27
• 为了增加QTL检测能力,可以增加判型的个体数 目或标记密度;两者之间花费依赖于标记的成本 与获得个体表型成本之间的比率。
19:27
增加检测能力的方式
• 增加样本大小; • 增加效应大小。
– 后者可以通过选择一个具有丰富分离QTL的群 体结构或样本;
– 如后裔检验。
19:27
精细定位QTL的群体设计
j
Pj m (1)
• α is declared FDR (such as 0.05) • j is the largest order that met formula (1) • m is the number of marker
19:27
FDR(false discovery rate)
QTL位于距峰值距离为 d的位置,
• 检验统计量为全QTL模型在峰值位置和距离峰值位
置 d图距单位位置的似然函数的差值的两倍,当样
本为大样本时,它近似呈自由度为1的 2分布;
• 因此可以通过偏离峰值位置,使检验统计量降到一 个给定的数值来对QTL位置置信区间进行检验。
19:27
• 例如: – 95%的QTL置信区间对应的检验统计量下降 3.84;
19:27
19:27
多次检测问题
• 如果有许多独立的零假设被检验,而且事 先知道所有的零假设都为真,则,至少出 现一次假显著(false positive)的概率为
1 (1 )n
19:27
伯努利校正
1 (1 )1 n n
19:27
Permutation test
H0 true
Rejection of H0
Type I error at rate
Nonrejection of H0 Nonsignificant result
Significant result HA true
Type II error at rate
19:27
POWER =(1- )
标 记 和
概 率
19:27
数据分析
• yij为具有QTL基因型 j的个体 i 的性状记录; • m j为具有QTL基因型 j的个体的期望效应(如 m d
或 m a ); • eij为随机误差,并且 eij ~ N (0, 2 ),因此有:
yij ~ N (mj , 2 )
19:27
Locus-based strategies:
Selective phenotyping Recombinant progeny testing Interval specific congenic strains (ISCS) Recombinant inbred segregation test (RIST)
相关文档
最新文档