QTL定位方法之区间分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
QTL定位方法之区间分析
摘要:随着分子生物学技术与数量遗传学的发展,在动植物上进行QTL定位成为现代生物科学研究的重要领域。QTL 定位就是采用类似单基因定位的方法将QTL 定位在遗传图谱上, 确定QTL 与遗传标记间的距离( 以重组率表示) 。定位过程中,一系列的定位方法得到研究与应用,根据标记区间数可分为零区间作图、单区间作图和多区间作图。此外, 还有将不同方法结合起来的综合分析方法, 如QTL 复合区间作图( CIM) 多区间作图( MIM) 、多QTL 作图、多性状作图( MTM) 等。本文就QTL定位方法的区间分析进行了综述。
关键词:QTL定位方法;区间分析;区间作图
1 区间作图法(Interval Mapping,IM)
20世纪80年代以来,随着分子遗传标记的增多,许多物种构建了精细的分子遗传标记图谱,为在整个基因组范围内检测QTLs提供了可能。Lander 和Botstein( 1989)[1]等提出, 建立在个体数量性状观测值与双侧标记基因型变量的线性模型的基础上, 利用最
大似然法对相邻标记构成的区间内任意一点可能存在的QTL 进行似然比检测, 进而获得其效应的极大似然估计。其遗传假设是, 数量性状遗传变异只受一对基因控制,表型变异受遗传效应( 固定效应) 和剩余误差( 随机效应) 控制, 不存在基因型与环境的互作。区间作图法可以估算QTL 加性和显性效应值。与单标记分析法相比, 区间作图法具有以下特点:能从支撑区间推断QTL 的可能位置;可利用标记连锁图在全染色体组系统地搜索QTL, 如果一条染色体上只有一个QTL, 则QTL 的位置和效应估计趋于渐进偏; QTL 检测所需的个体数大大减少。但IM也存在不足: QTL 回归效应为固定效应;无法估算基因型与环境间的互作( Q×E) , 无法检测复杂的遗传效应( 如上位效应等) 当相邻QTLs 相
距较近时, 由于其作图精度不高, QTLs间相互干扰导致出现Ghost QTL;一次只应用两个标记进行检查, 效率很低。Haley和Knot提出了区间作图的回归方法[2,3],可以产生与最大似然估计类似的结果,但对剩余方差的估计有偏,QTL检测的有效性可能受到影响。
2复合区间作图法(composite interval mappig,CIM)
CIM是Zeng( 1994) [4]提出的结合了区间作图和多元回归特点的一种QTL 作图方法。其遗传假定是, 数量性状受多基因控制。该方法中拟合了其他遗传标记, 即在对某一特定标记区间进行检测时, 将与其他QTL 连锁的标记也拟合在模型中以控制背景遗传效应。CIM主要优点是: 由于仍采用QTL 似然图来显示QTL 的可能位置及显著程度, 从而保证了IM作图法的优点; 假如不存在上位性和QTL 与环境互作, QTL 的位置和效应的估计是渐进无偏的; 以所选择的多个标记为条件( 即进行的是区间检测) , 在较大程度上控制了背景遗传效应, 从而提高了作图的精度和效率。存在的不足是: 由于将两侧标记用
作区间作图, 对相邻标记区间的QTL 估计会引起偏离; 同IM一样, 将回归效应视为固定效应, 不能分析基因型与环境的互作及复杂的遗传效应( 如上位效应等) 当标记密度过
大时, 很难选择标记的条件因子。
与传统的单标记分析法相比, Lander和Botstein的区间作图法有其明显的优点[6]: ( 1)能从支持区间推断QTL的可能位置; ( 2)假设一条染色体上只有一个QTL , QTL 的位置和效应估计趋于渐近无偏; ( 3)能使QTL检测所需的个体数减少。因而, 区间作图法一度成为QTL作图的标准方法。
但是, 区间作图法仍存在许多问题[7]:(1)与检验区间连锁的QTL会影响检验结果,
或者导致假阳性, 或者使QTL的位置和效应估计出现偏差。(2)每次检验仅用两个标记, 其他标记的信息未加以利用。认识到这个问题, Lander和Botstein [6]提出对多个区间上的多个QTL进行同步检测的策略。但这种检测涉及到多维空间, 在参数估计和模型鉴别上存在一些困难。Martinez 和Curnow(1992)[8]则提出用三个或更多的标记进行回归分析, 这样势必要增加样本容量和计算难度。加之,一个染色体上的QTL数目是未知的, 拟合和检测错误的模型会使QTL的位置和效应估计有偏。另外, 其他标记的信息仍未得到利用。
3基于混合线性模型的复合区间作图法
朱军( 1998) 提出了用随机效应的预测方法获得基因型效应及基因型与环境互作效应, 然后再用区间作图法或复合区间作图法进行遗传主效应及基因型与环境互作效应的QTL 定位分析。该方法的遗传假定是数量性状受多基因控制, 它将群体均值及QTL 的各项遗传效应看作为固定效应, 而将环境、QTL 与环境、分子标记等效应看作为随机效应。由于MCIM将效应值估计和定位分析相结合, 既可无偏地分析QTL 与环境的互作效应, 又提高了作图的精度和效率。此外该模型可以扩展到分析具有加×加、加×显、显×显上位的各种遗传主效应及其与环境互作效应的QTL。利用这些效应值的估计, 可预测基于QTL 主效应的普通杂种优势和基于QTL 与环境互作效应的互作杂种优势, 因而其具有广阔的应用前景。
复合区间作图法的主要优点是(Zeng): (1)仍采用QTL似然图来显示QTL的可能位置及显著程度, 从而保留了区间作图法的优点; (2)一次只检验一个区间,把对多个QTL 的多维搜索降低为一维搜索; (3)假如不存在上位性和QTL与环境互作,QTL的位置和效应的估计是渐近无偏的;(4)充分利用了整个基因组的标记信息; (5)以所选择的多个标
记为条件, 在较大程度上控制了背景遗传效应, 提高了作图的精度和效率[9]。
复合区间作图法目前存在的主要问题有: (1)不能分析上位性及QTL与环境互作等
复杂的遗传学问题; (2)为了保证检验统计量有一定的自由度, 需要从大量的标记中筛选一部分有效的标记, 而筛选时采用的显著性水平以及筛选的方法均会对定位结果产生影响[7]; (3)由于拟合在模型中的标记会吸收其附近的QTL效应, 复合区间作图法需要为检