种畜的遗传评估PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分组
初产年龄(等级)
1
2
3
产犊季节
1
114
143
145
150
2
109
103
163
117
线性模型举例
母牛的乳脂量生产成绩表(Schaeffer L R,1993)
线性模型的分类 固定效应模型(fixed model) 如一个模型中除了随机误差外,其余所有的效应均为固定效应,则称此模型为固定效应模型或固定模型。 随机效应模型(random model) 若模型中除了总平均数外,其余的所有效应均为随机效应,则称此模型为随机效应模型或随机模型 混合模型 (mixed model) 若模型中除了总平均数和随机误差之外,既含有固定效应,也含有随机效应,则称之为混合模型
由此可得:
混合模型方程组为:
方程组的解为: 两性状动物模型BLUP法育种值估计 某种猪场有如下种猪性能测定资料,测定性状为达100 kg日龄和达100kg背膘 ,试以两个性状资料进行个体育种值估计。
种猪达100kg日龄和达100kg背膘厚测定记录
猪场
个体
父亲
母亲
达100kg日龄(d)
是公畜间加性遗传相关矩阵
是外祖父间加性遗传相关矩阵
假设和约束条件: 主要适用于种公牛评定 动物只有一个记录 有记录的动物不是其它动物的双亲 双亲无记录 每个母畜只有一个后代 ,且外祖母只有一个女儿 母畜在外祖父所有女儿中随机抽样 混合模型方程组:
,
BLUP原理同样可使用于对多个性状进行育种值估计 当我们要对个体在多个性状上的育种值进行估计时,一种方法可以分别对每一性状单独进行估计,然后根据性状之间的经济重要性进行综合, 另一种方法可以利用一个多性状模型对多个性状同时进行估计。由于同时进行估计时考虑了性状间的相关,利用了更多的信息,同时可校正由于对某些性状进行了选择而产生的偏差,因而可提高估计的准确度。提高的程度取决于性状的遗传力,性状间的相关性和每个性状的信息量 。在这里,仅以两性状动物模型BLUP法为例简单讨论多性状动物模型BLUP的方法问题。
方程组的解为: 综合育种值为:
如果说模型是BLUP法的关键,那么,计算问题则是BLUP法的难点。从前面例子我们可以看出,仅仅5个个体两个性状就产生很大的方程组,而对于猪、鸡等畜禽在BLUP法中所涉及的线性方程组是非常大的,对一些跨群(场)的遗传评定,方程组个数可达几万至几十万,如此大数量的方程组用手工计算是根本不可能的 近年来,世界各国育种学家在BLUP法的计算问题上做了大量的工作,已开发出相应的电脑软件,如国外的PEST 和国内的NETPIG。下面对一些常用的遗传评估软件进行介绍。
经典的迭代方法 高斯-赛德尔迭代法 (gauss-seidel) 雅可比迭代法(jacobi) 松弛迭代法(relaxation) 收敛标准(convergence criteria) 一般标准 改进标准
列表法计算分子亲缘矩阵 构造所有个体的系谱列表 ,父母亲号先于个体号 构建分子亲缘矩阵 个体 的父母未知时: 个体 的父或母为 时 : 个体 的父母已知为 或 时:
是公畜间加性遗传相关矩阵
是母畜间加性遗传相关矩阵
假设和约束条件: 只适用于后裔测定的父、母亲育种值预测,而且主要适用于猪、鸡等母畜繁殖力高的畜禽 动物只有一个记录 有记录的动物不是其它动物的双亲 双亲无记录 混合模型方程组:
外祖父模型 (maternal grandsire model ) 数学方程式: 是公畜四分之一的加性遗传效应向量 是 的关联矩阵 期望和方差:
达100kg背膘厚(mm)
1
1
—
—
140
13
1
2
—
—
152
14
1
3
1
—
135
12
2
4
1
2
143
13
2
5
3
2
160
16
根据资料性质,可对种猪达100kg日龄和达100kg背膘厚写出如下动物模型: 是第 性状,第 猪场,第 个体的观测值 是第 性状,第 猪场的效应 是第 性状,第 个体的育种值 是随机残差
线性模型(Linear model) 线性模型是指在模型中所包含的各个因子是以相加的形式影响观察值,即它们与观察值的关系为线性关系,但对于连续性的协变量也允许出现平方或立方项 一个线性模型应由3个部分组成: 数学方程式 方程式中随机变量的期望和方差及协方差 假设、约束和限制条件
数学方程式: 期望和方差: 假设和约束条件: 所有母牛都来自同一品种 所有母牛都在相同的环境下以相同的饲养方式饲养 所有的母牛都来自同一公牛 所有的母牛的母亲对母牛的乳脂量无影响
六、BLUP育种值估计举例
单性状动物模型BLUP育种值估计 某种猪场有如下种猪性能测定资料,测定性状为达100 kg日龄,已知该性状的遗传力为0.33,试对该性状资料进行个体育种值估计。
种猪达100kg日龄记录
猪场
个体
父亲
母亲
达100kg日龄
1
1
—
—
140
1
2
—
—
152
1
3
1
—
135
2
4
1
2
143
因子 离散型 通常表现为若干个有限的等级或水平 固定因子 ——有意识地抽取若干个特定的水平,目的是对这些水平的效应进行估计或进行比较 ,如年效应 随机因子——因子的若干水平可看作是来自该因子的所有水平所构成的总体的随机样本,目的是要通过该样本去推断总体,如个体的遗传效应。 连续型 它呈现连续性变异,通常是作为影响观察值的协变量(回归变量)
七、BLUP育种值估计软件
PEST PEST是由美国Illinois大学的Groeneveld、Kovac和Wang(1990)开发研制的多性状遗传评估软件,其英文全文名为(Multivariate Prediction and ESTimation,目前已在世界各国广泛应用。 根据性能测定和生产数据,PEST提供了基于30多种数学模型的单性状或多性状BLUP育种值的计算,包括固定模型、个体动物模型、公畜模型、公畜—母畜模型和外祖父模型等 。为了满足实际育种的需要,系统还提供了可自行定义性状、修改模型和设定参数的余地。PEST可以在不同的操作系统下运行。
一、线性模型基础知识
模型(Model) 模型是描述观察值与影响观察值变异性的各因子之间的关系的数学方程式 分类 真实模型——非常准确地模拟观察值的变异性,模型中不含有未知成分 理想模型——根据研究者所掌握的专业知识建立的尽可能接近真实模型的模型 操作模型——用于实际统计分析的模型,它通常是理想模型的简化形式
五、多性状BLUP 法的基本原理
假设有性状1和2可用如下的模型表示: 可写成矩阵形式:
是性状1和2 的遗传方差和协方差矩阵
是性状1和2 的残差方差和协方差矩阵
是Kronecker乘积
令 根据混合模型方程组的简化形式有: 获得综合育种值 得到各个个体两个性状的估计育种值后,可用性状经济重要性进行加权计算综合育种值,或者将估计育种值转化为标准化的估计育种值,然后再加权计算综合育种值。即:
二、BLUP的基本原理
一般混合模型可表示为: 是所有观察值构成的向量 是所有固定效应(包括)构成的向量 是固定效应的关联矩阵 是所有随机效应构成的向量 是随机效应的关联矩阵 是随机残差向量 随机变量的数学期望: 方差-协方差矩阵结构:
,
,
,
BLUP 的统计特性 可估函数: 预测函数: 预测误差: BLUP分析的实质是利用观察值的一个线性函数( )对固定效应和随机效应的任意线性可估函数( )进行估计和预测,要求同时满足预测的无偏性和预测误差方差最小(最佳)两个条件,由此得到 的最佳线性无偏估计值(BLUE), 的最佳线性无偏预测值(BLUP)
传统的选择指数法的基本假设是不存在影响观察值的系统环境效应,或者在使用前剔除了系统环境效应。 遗憾的是这个基本假设在几乎所有实际情况下都是不能成立的,如乳用母牛饲养在管理条件不同的牛群中 为克服以上缺陷,Henderson于1948年提出了BLUP方法,即最佳线性无偏预测,这个统计方法可同时估计固定效应(例如系统环境效应)和育种值。传统的选择指数是具有已知固定效应的BLUP方法的一种特殊情形 随着计算机技术的高速发展,使这一方法的实际应用成为可能,目前BLUP法已成为世界各国(尤其是发达国家)家畜遗传评定的规范方法
如果双亲已知为 和 : 如果个体父或母已知 为:
要加入的数值
中的位置
要加入的数值
中的位置
如果是一个非近交群体 ,则可直接构建 如果双亲已知为 和 : 如果个体父或母已知为 :
要加入的数值
中的位置
2
-1
0.5
要加入的数值
中的位置
3/4
-2/3
1/3
分子亲缘矩阵逆矩阵的计算 构造所有个体的系谱列表 ,父母亲号先于个体号 构建三角矩阵 个体 的父母未知时: 个体 的父或母为 时: 个体的父母已知为 或 ,假设 ,这时:
分子亲缘矩阵逆矩阵的计算 令 为 对角线元素组成的对角阵,让 按以下规则加入已知父母的个体的有关元素构建
BLUP 估计一般方程 BLUP法前提条件 所用的表型信息必须真实可靠,系谱资料必须正确完整 所用的模型是真实模型; 模型中的随机效应的方差组分或方差组分的比值已知
混合模型方程组的一般形式 混合模型方程组的简化形式
混合模型方程组的度量
为 中与 个体对应的对角线元素
四、育种值估计模型
动物模型 (animal model ) 数学方程式: 是观察值向量 是所有固定效应向量 是 的关联矩阵 是个体育种值向量 是 的关联矩阵 是随机残差向量 期望和方差:
混合模型方程组: 公畜模型 (sire model ) 数学方程式: 是公畜二分之一的加性遗传效应向量 是 的关联矩阵 期望和方差:
猪两个性状的表型、遗传参数和经济加权值 (表中右边2项的右上角为表型相关,左下角为遗传相关)
性状
单位
达100kg日龄( )
d
-0.6
0.33
225
—
0.55
达100kg背膘厚( )
mm
-0.8
0.50
1.44
0.45
—
构建混合模型方程组 由上一个例子得到:
由遗传参数表可计算出性状间的遗传和误差方差及协方差为: 逆矩阵为: 混合模型方程组为:
是公畜间加性遗传相关矩阵
假设和约束条件: 只可用来估计公畜的育种值 公畜在群体中与母畜的交配是完全随机的 母亲之间没有血源关系 每个母亲只有一个后代,即一个公畜的所有后代都是父系半同胞。 混合模型方程组:
公畜—母畜模型 (sire-dam model ) 数学方程式: 是公畜二分之一的加性遗传效应向量 是 的关联矩阵 是母畜二分之一的加性遗传效应向量 是 的关联矩阵 期望和方差:
种畜的遗传评估
随着数理统计学与线性模型理论、计算机科学与互联网络技术的迅速发展,家畜育种值估计的方法发生了根本的变化。 以Henderson为代表所发展起来的BLUP(Best Linear Unbiased Prediction)育种值估计法,将畜禽遗传育种的理论与实践带入了一个新的发展阶段。
2
5
3
2
160
个体间加性遗传相关矩阵 及 的计算
按前述构建规则有:
其它元素类似计算,要构建 ,必须先构建 :
得到: 令 ,将其它元素添加到 :
计算个体育种值 根据资料性质,可对种猪达100kg日龄写出如下动物模型: 是第 猪场,第 个体的观测值 是第 猪场的效应 第 个体的育种值 是随机残差 用矩阵形式表示,则对于该资料有:
三、BLUP的计算技术
混合模型方程组的求解 经典解法 先求出方程组的系数矩阵和等式右边的向量,建立方程组,然后迭代求解 缺点:混合模型方程组往往很大,容易受计算机内存的限制,实际应用范围不广 间接解法 不需建立方程组,直接构建观测数据迭代公式,每次迭代读入原始数据包括性状观测值和系谱记录,并同时计算该次迭代的解 通用性不强,需要构建特定的数据迭代公式
初产年龄(等级)
1
2
3
产犊季节
1
114
143
145
150
2
109
103
163
117
线性模型举例
母牛的乳脂量生产成绩表(Schaeffer L R,1993)
线性模型的分类 固定效应模型(fixed model) 如一个模型中除了随机误差外,其余所有的效应均为固定效应,则称此模型为固定效应模型或固定模型。 随机效应模型(random model) 若模型中除了总平均数外,其余的所有效应均为随机效应,则称此模型为随机效应模型或随机模型 混合模型 (mixed model) 若模型中除了总平均数和随机误差之外,既含有固定效应,也含有随机效应,则称之为混合模型
由此可得:
混合模型方程组为:
方程组的解为: 两性状动物模型BLUP法育种值估计 某种猪场有如下种猪性能测定资料,测定性状为达100 kg日龄和达100kg背膘 ,试以两个性状资料进行个体育种值估计。
种猪达100kg日龄和达100kg背膘厚测定记录
猪场
个体
父亲
母亲
达100kg日龄(d)
是公畜间加性遗传相关矩阵
是外祖父间加性遗传相关矩阵
假设和约束条件: 主要适用于种公牛评定 动物只有一个记录 有记录的动物不是其它动物的双亲 双亲无记录 每个母畜只有一个后代 ,且外祖母只有一个女儿 母畜在外祖父所有女儿中随机抽样 混合模型方程组:
,
BLUP原理同样可使用于对多个性状进行育种值估计 当我们要对个体在多个性状上的育种值进行估计时,一种方法可以分别对每一性状单独进行估计,然后根据性状之间的经济重要性进行综合, 另一种方法可以利用一个多性状模型对多个性状同时进行估计。由于同时进行估计时考虑了性状间的相关,利用了更多的信息,同时可校正由于对某些性状进行了选择而产生的偏差,因而可提高估计的准确度。提高的程度取决于性状的遗传力,性状间的相关性和每个性状的信息量 。在这里,仅以两性状动物模型BLUP法为例简单讨论多性状动物模型BLUP的方法问题。
方程组的解为: 综合育种值为:
如果说模型是BLUP法的关键,那么,计算问题则是BLUP法的难点。从前面例子我们可以看出,仅仅5个个体两个性状就产生很大的方程组,而对于猪、鸡等畜禽在BLUP法中所涉及的线性方程组是非常大的,对一些跨群(场)的遗传评定,方程组个数可达几万至几十万,如此大数量的方程组用手工计算是根本不可能的 近年来,世界各国育种学家在BLUP法的计算问题上做了大量的工作,已开发出相应的电脑软件,如国外的PEST 和国内的NETPIG。下面对一些常用的遗传评估软件进行介绍。
经典的迭代方法 高斯-赛德尔迭代法 (gauss-seidel) 雅可比迭代法(jacobi) 松弛迭代法(relaxation) 收敛标准(convergence criteria) 一般标准 改进标准
列表法计算分子亲缘矩阵 构造所有个体的系谱列表 ,父母亲号先于个体号 构建分子亲缘矩阵 个体 的父母未知时: 个体 的父或母为 时 : 个体 的父母已知为 或 时:
是公畜间加性遗传相关矩阵
是母畜间加性遗传相关矩阵
假设和约束条件: 只适用于后裔测定的父、母亲育种值预测,而且主要适用于猪、鸡等母畜繁殖力高的畜禽 动物只有一个记录 有记录的动物不是其它动物的双亲 双亲无记录 混合模型方程组:
外祖父模型 (maternal grandsire model ) 数学方程式: 是公畜四分之一的加性遗传效应向量 是 的关联矩阵 期望和方差:
达100kg背膘厚(mm)
1
1
—
—
140
13
1
2
—
—
152
14
1
3
1
—
135
12
2
4
1
2
143
13
2
5
3
2
160
16
根据资料性质,可对种猪达100kg日龄和达100kg背膘厚写出如下动物模型: 是第 性状,第 猪场,第 个体的观测值 是第 性状,第 猪场的效应 是第 性状,第 个体的育种值 是随机残差
线性模型(Linear model) 线性模型是指在模型中所包含的各个因子是以相加的形式影响观察值,即它们与观察值的关系为线性关系,但对于连续性的协变量也允许出现平方或立方项 一个线性模型应由3个部分组成: 数学方程式 方程式中随机变量的期望和方差及协方差 假设、约束和限制条件
数学方程式: 期望和方差: 假设和约束条件: 所有母牛都来自同一品种 所有母牛都在相同的环境下以相同的饲养方式饲养 所有的母牛都来自同一公牛 所有的母牛的母亲对母牛的乳脂量无影响
六、BLUP育种值估计举例
单性状动物模型BLUP育种值估计 某种猪场有如下种猪性能测定资料,测定性状为达100 kg日龄,已知该性状的遗传力为0.33,试对该性状资料进行个体育种值估计。
种猪达100kg日龄记录
猪场
个体
父亲
母亲
达100kg日龄
1
1
—
—
140
1
2
—
—
152
1
3
1
—
135
2
4
1
2
143
因子 离散型 通常表现为若干个有限的等级或水平 固定因子 ——有意识地抽取若干个特定的水平,目的是对这些水平的效应进行估计或进行比较 ,如年效应 随机因子——因子的若干水平可看作是来自该因子的所有水平所构成的总体的随机样本,目的是要通过该样本去推断总体,如个体的遗传效应。 连续型 它呈现连续性变异,通常是作为影响观察值的协变量(回归变量)
七、BLUP育种值估计软件
PEST PEST是由美国Illinois大学的Groeneveld、Kovac和Wang(1990)开发研制的多性状遗传评估软件,其英文全文名为(Multivariate Prediction and ESTimation,目前已在世界各国广泛应用。 根据性能测定和生产数据,PEST提供了基于30多种数学模型的单性状或多性状BLUP育种值的计算,包括固定模型、个体动物模型、公畜模型、公畜—母畜模型和外祖父模型等 。为了满足实际育种的需要,系统还提供了可自行定义性状、修改模型和设定参数的余地。PEST可以在不同的操作系统下运行。
一、线性模型基础知识
模型(Model) 模型是描述观察值与影响观察值变异性的各因子之间的关系的数学方程式 分类 真实模型——非常准确地模拟观察值的变异性,模型中不含有未知成分 理想模型——根据研究者所掌握的专业知识建立的尽可能接近真实模型的模型 操作模型——用于实际统计分析的模型,它通常是理想模型的简化形式
五、多性状BLUP 法的基本原理
假设有性状1和2可用如下的模型表示: 可写成矩阵形式:
是性状1和2 的遗传方差和协方差矩阵
是性状1和2 的残差方差和协方差矩阵
是Kronecker乘积
令 根据混合模型方程组的简化形式有: 获得综合育种值 得到各个个体两个性状的估计育种值后,可用性状经济重要性进行加权计算综合育种值,或者将估计育种值转化为标准化的估计育种值,然后再加权计算综合育种值。即:
二、BLUP的基本原理
一般混合模型可表示为: 是所有观察值构成的向量 是所有固定效应(包括)构成的向量 是固定效应的关联矩阵 是所有随机效应构成的向量 是随机效应的关联矩阵 是随机残差向量 随机变量的数学期望: 方差-协方差矩阵结构:
,
,
,
BLUP 的统计特性 可估函数: 预测函数: 预测误差: BLUP分析的实质是利用观察值的一个线性函数( )对固定效应和随机效应的任意线性可估函数( )进行估计和预测,要求同时满足预测的无偏性和预测误差方差最小(最佳)两个条件,由此得到 的最佳线性无偏估计值(BLUE), 的最佳线性无偏预测值(BLUP)
传统的选择指数法的基本假设是不存在影响观察值的系统环境效应,或者在使用前剔除了系统环境效应。 遗憾的是这个基本假设在几乎所有实际情况下都是不能成立的,如乳用母牛饲养在管理条件不同的牛群中 为克服以上缺陷,Henderson于1948年提出了BLUP方法,即最佳线性无偏预测,这个统计方法可同时估计固定效应(例如系统环境效应)和育种值。传统的选择指数是具有已知固定效应的BLUP方法的一种特殊情形 随着计算机技术的高速发展,使这一方法的实际应用成为可能,目前BLUP法已成为世界各国(尤其是发达国家)家畜遗传评定的规范方法
如果双亲已知为 和 : 如果个体父或母已知 为:
要加入的数值
中的位置
要加入的数值
中的位置
如果是一个非近交群体 ,则可直接构建 如果双亲已知为 和 : 如果个体父或母已知为 :
要加入的数值
中的位置
2
-1
0.5
要加入的数值
中的位置
3/4
-2/3
1/3
分子亲缘矩阵逆矩阵的计算 构造所有个体的系谱列表 ,父母亲号先于个体号 构建三角矩阵 个体 的父母未知时: 个体 的父或母为 时: 个体的父母已知为 或 ,假设 ,这时:
分子亲缘矩阵逆矩阵的计算 令 为 对角线元素组成的对角阵,让 按以下规则加入已知父母的个体的有关元素构建
BLUP 估计一般方程 BLUP法前提条件 所用的表型信息必须真实可靠,系谱资料必须正确完整 所用的模型是真实模型; 模型中的随机效应的方差组分或方差组分的比值已知
混合模型方程组的一般形式 混合模型方程组的简化形式
混合模型方程组的度量
为 中与 个体对应的对角线元素
四、育种值估计模型
动物模型 (animal model ) 数学方程式: 是观察值向量 是所有固定效应向量 是 的关联矩阵 是个体育种值向量 是 的关联矩阵 是随机残差向量 期望和方差:
混合模型方程组: 公畜模型 (sire model ) 数学方程式: 是公畜二分之一的加性遗传效应向量 是 的关联矩阵 期望和方差:
猪两个性状的表型、遗传参数和经济加权值 (表中右边2项的右上角为表型相关,左下角为遗传相关)
性状
单位
达100kg日龄( )
d
-0.6
0.33
225
—
0.55
达100kg背膘厚( )
mm
-0.8
0.50
1.44
0.45
—
构建混合模型方程组 由上一个例子得到:
由遗传参数表可计算出性状间的遗传和误差方差及协方差为: 逆矩阵为: 混合模型方程组为:
是公畜间加性遗传相关矩阵
假设和约束条件: 只可用来估计公畜的育种值 公畜在群体中与母畜的交配是完全随机的 母亲之间没有血源关系 每个母亲只有一个后代,即一个公畜的所有后代都是父系半同胞。 混合模型方程组:
公畜—母畜模型 (sire-dam model ) 数学方程式: 是公畜二分之一的加性遗传效应向量 是 的关联矩阵 是母畜二分之一的加性遗传效应向量 是 的关联矩阵 期望和方差:
种畜的遗传评估
随着数理统计学与线性模型理论、计算机科学与互联网络技术的迅速发展,家畜育种值估计的方法发生了根本的变化。 以Henderson为代表所发展起来的BLUP(Best Linear Unbiased Prediction)育种值估计法,将畜禽遗传育种的理论与实践带入了一个新的发展阶段。
2
5
3
2
160
个体间加性遗传相关矩阵 及 的计算
按前述构建规则有:
其它元素类似计算,要构建 ,必须先构建 :
得到: 令 ,将其它元素添加到 :
计算个体育种值 根据资料性质,可对种猪达100kg日龄写出如下动物模型: 是第 猪场,第 个体的观测值 是第 猪场的效应 第 个体的育种值 是随机残差 用矩阵形式表示,则对于该资料有:
三、BLUP的计算技术
混合模型方程组的求解 经典解法 先求出方程组的系数矩阵和等式右边的向量,建立方程组,然后迭代求解 缺点:混合模型方程组往往很大,容易受计算机内存的限制,实际应用范围不广 间接解法 不需建立方程组,直接构建观测数据迭代公式,每次迭代读入原始数据包括性状观测值和系谱记录,并同时计算该次迭代的解 通用性不强,需要构建特定的数据迭代公式