家畜育种学07种畜的遗传评估(三):BLUP育种值估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
也允许出现平方或立方项。 一个线性模型应由3个部分组成: 1. 数学方程式 2. 方程式中随机变量的期望和方差及协方差 3. 假设、约束和限制条件
http://jpk.sicau.edu.cn/jcyzx/index.htm
线性模型举例
母牛的乳脂量生产成绩表(Schaeffer L R,1993)
x
(k ) i
( ri
c ij x j
( k 1 )
) c ii x i
( k 1 )
j 1
松弛迭代法(relaxation)
xi
( improved )
xi
(k )
( xi
(k )
xi
( k 1 )
)
收敛标准(convergence criteria)
一般标准 max x ( t ) x ( t 1) i i 改进标准
第一节 线性模型基础知识 第二节 BLUP的基本原理 第三节 BLUP的计算技术 第四节 育种值估计模型 第五节 多性状BLUP 法的基本原理 第六节 BLUP育种值估计举例 第七节 BLUP育种值估计软件
wenku.baidu.com
随着数理统计学与线性模型理论、计算机科学与 互联网络技术的迅速发展,家畜育种值估计的方
模型(Model)
模型是描述观察值与影响观察值变异性的各因子之间
的关系的数学方程式 分类
• 真实模型——非常准确地模拟观察值的变异性,
模型中不含有未知成分 • 理想模型——根据研究者所掌握的专业知识建立 的尽可能接近真实模型的模型 • 操作模型——用于实际统计分析的模型,它通常
是理想模型的简化形式
http://jpk.sicau.edu.cn/jcyzx/index.htm
线性模型的分类 固定效应模型(fixed model)
• 如一个模型中除了随机误差外,其余所有的效应均为
固定效应,则称此模型为固定效应模型或固定模型。
随机效应模型(random model)
• 若模型中除了总平均数外,其余的所有效应均为随机 效应,则称此模型为随机效应模型或随机模型
http://jpk.sicau.edu.cn/jcyzx/index.htm
经典的迭代方法
高斯-赛德尔迭代法 (gauss-seidel)
x
(k ) i
( ri c ij x
j 1 n
i 1
(k ) j
j i 1
c ij x j
n
( k 1 )
) c ii
雅可比迭代法(jacobi)
2 2 2
http://jpk.sicau.edu.cn/jcyzx/index.htm
混合模型方程组的度量
ˆ b C xx Var u 0 ˆ G C zz 0 C xz C zz
( u d a e ) / u
u G Var e 0
0 R
http://jpk.sicau.edu.cn/jcyzx/index.htm
BLUP 的统计特性
可估函数: b M u K
预测函数:L y
预测误差:K b M u L y
BLUP分析的实质是利用观察值的一个线性函数( L y )
1
•
如果个体父或母已知 p 为:
要加入的数值
0 .5 a ii
0 . 25 a ii
A 中的位置 ( p , i ), ( i , p ), ( q , i ), ( i , q ) ( p , p ), ( p , q ), ( q , p ), ( q , q )
http://jpk.sicau.edu.cn/jcyzx/index.htm
y 是所有观察值构成的向量
, , ,
b 是所有固定效应(包括)构成的向量
X 是固定效应的关联矩阵 u 是所有随机效应构成的向量 Z 是随机效应的关联矩阵 e 是随机残差向量 随机变量的数学期望: E ( b ) b E ( u ) 0 E ( e ) 0 E ( y ) Xb
方差-协方差矩阵结构:
殊情形。
随着计算机技术的高速发展,使这一方法的实际应用成为可能,目前 BLUP法已成为世界各国(尤其是发达国家)家畜遗传评定的规范方
法 。
http://jpk.sicau.edu.cn/jcyzx/index.htm
第二节
BLUP的基本原理
y Xb Zu e
一般混合模型可表示为:
分组 1 产 犊 季 节 初产年龄(等级) 1 114 150 109 2 163 117 103 2 143 3 145
数学方程式: y ijk a i b j eijk 期望和方差:E ( y ijk ) a i b j E ( eijk ) 0 2 假设和约束条件: V ( y ijk ) V ( e ijk ) i 所有母牛都来自同一品种 所有母牛都在相同的环境下以相同的饲养方式饲养 所有的母牛都来自同一公牛 所有的母牛的母亲对母牛的乳脂量无影响
l tt 1 l ti
2 i 1 p
p t 1
0 . 75 0 . 25 f p
个体的父母已知为 p 或 q ,假设 p q
0 . 5 ( l pi l qi ) l ti 0 . 5 l qi 0 i 1、
,这时:
2、 p q t 1
混合模型 (mixed model)
• 若模型中除了总平均数和随机误差之外,既含有固定
效应,也含有随机效应,则称之为混合模型
http://jpk.sicau.edu.cn/jcyzx/index.htm
传统的选择指数法的基本假设是不存在影响观察值的系统环境效应, 或者在使用前剔除了系统环境效应。 遗憾的是这个基本假设在几乎所有实际情况下都是不能成立的,如乳 用母牛饲养在管理条件不同的牛群中。 为克服以上缺陷,Henderson于1948年提出了BLUP方法,即最佳线性 无偏预测,这个统计方法可同时估计固定效应(例如系统环境效应) 和育种值。传统的选择指数是具有已知固定效应的BLUP方法的一种特
第三节
BLUP的计算技术
混合模型方程组的求解 经典解法
• 先求出方程组的系数矩阵和等式右边的向量,建立 方程组,然后迭代求解 • 缺点:混合模型方程组往往很大,容易受计算机内 存的限制,实际应用范围不广
间接解法
• 不需建立方程组,直接构建观测数据迭代公式,每 次迭代读入原始数据包括性状观测值和系谱记录, 并同时计算该次迭代的解 • 通用性不强,需要构建特定的数据迭代公式
法发生了根本的变化。
以Henderson为代表所发展起来的BLUP(Best
Linear Unbiased Prediction)育种值估计法,
将畜禽遗传育种的理论与实践带入了一个新的发 展阶段。
http://jpk.sicau.edu.cn/jcyzx/index.htm
第一节
线性模型基础知识
http://jpk.sicau.edu.cn/jcyzx/index.htm
因子
离散型
• • 通常表现为若干个有限的等级或水平 固定因子 ——有意识地抽取若干个特定的水平, 目的是对这些水平的效应进行估计或进行比较 , 如年效应 随机因子——因子的若干水平可看作是来自该因 子的所有水平所构成的总体的随机样本,目的是 要通过该样本去推断总体,如个体的遗传效应。
http://jpk.sicau.edu.cn/jcyzx/index.htm
混合模型方程组的一般形式
X R 1 X Z R 1 X ˆ b X R 1 y 1 1 Z R 1 y ˆ Z R Z G u X R Z
分子亲缘矩阵逆矩阵的计算
3. 令 D 为 L 对角线元素组成的对角阵,让 A 1 ( D 1 ) 2 4. 按以下规则加入已知父母的个体的有关元素构建 A 1 • 如果双亲已知为 p 和 q :
要加入的数值
0 .5 a ii
0 . 25 a ii
A 中的位置 ( p , i ), ( i , p ), ( q , i ), ( i , q ) ( p , p ), ( p , q ), ( q , p ), ( q , q )
t 1
http://jpk.sicau.edu.cn/jcyzx/index.htm
分子亲缘矩阵逆矩阵的计算
1. 构造所有个体的系谱列表 ,父母亲号先于个体号 2. 构建三角矩阵 L
个体 t 的父母未知时: l tt 1 i 1、 2、 t 1 l ti 0 个体 t 的父或母为 p 时: i 1、 2、 0 . 5 l pi l ti i p 1、 p 2、 0
2 2 2
i
ˆ b C xx Var u u C ˆ zx
ru uˆ
i i
ˆ Cov ( u i , u i )
u uˆ
i
1 du k
i
i
k e u
2
i
2
d u 为 C zz 中与 i 个体对应的对角线元素
http://jpk.sicau.edu.cn/jcyzx/index.htm
BLUP 估计一般方程
ˆ b ( X V
X) X V y 1 ˆ ˆ u G Z V (y X b )
1 1
BLUP法前提条件
1. 所用的表型信息必须真实可靠,系谱资料必须正确完
整 2. 所用的模型是真实模型;
3. 模型中的随机效应的方差组分或方差组分的比值已知
•
连续型
• 它呈现连续性变异,通常是作为影响观察值的协 变量(回归变量)
http://jpk.sicau.edu.cn/jcyzx/index.htm
线性模型(Linear model)
线性模型是指在模型中所包含的各个因子是 以相加的形式影响观察值,即它们与观察值
的关系为线性关系,但对于连续性的协变量
的父母未知时:
a ti a it 0
a ti a it 0 .5 a ip
i 1、 2、 t 1
个体 t 的父或母为 p 时 :
i 1、 2、 t 1
个体 t 的父母已知为 p 或 q 时:
a tt 1 0 . 5 a pq
i 1、 2、
a ti a it 0 . 5( a ip a iq )
对固定效应和随机效应的任意线性可估函数 ( K b M u )进行估计和预测,要求同时满足预测的 无偏性和预测误差方差最小(最佳)两个条件,由此得
u 到 b 的最佳线性无偏估计值(BLUE), 的最佳线性无
偏预测值(BLUP)。
http://jpk.sicau.edu.cn/jcyzx/index.htm
i p 1、 p 2、 i q 1、 q 2、
q 2
l tt
1 0 . 5 l pj l qj l ti
i 1 i 1
p
http://jpk.sicau.edu.cn/jcyzx/index.htm
0 . 5 0 . 25 ( f p f q )
(x
i 1
n
(t ) i
x
( t 1 ) i
)
2
( xi )
(t ) 2
http://jpk.sicau.edu.cn/jcyzx/index.htm
n
i 1
列表法计算分子亲缘矩阵
1.构造所有个体的系谱列表 ,父母亲号先于个体号
2.构建分子亲缘矩阵
个体 t
a tt 1 a tt 1
1
混合模型方程组的简化形式
X X Z X ˆ b X y 1 Z y Z Z k A u ˆ X Z
2
Var ( u ) G A u Var ( e ) R I e k e u
http://jpk.sicau.edu.cn/jcyzx/index.htm
线性模型举例
母牛的乳脂量生产成绩表(Schaeffer L R,1993)
x
(k ) i
( ri
c ij x j
( k 1 )
) c ii x i
( k 1 )
j 1
松弛迭代法(relaxation)
xi
( improved )
xi
(k )
( xi
(k )
xi
( k 1 )
)
收敛标准(convergence criteria)
一般标准 max x ( t ) x ( t 1) i i 改进标准
第一节 线性模型基础知识 第二节 BLUP的基本原理 第三节 BLUP的计算技术 第四节 育种值估计模型 第五节 多性状BLUP 法的基本原理 第六节 BLUP育种值估计举例 第七节 BLUP育种值估计软件
wenku.baidu.com
随着数理统计学与线性模型理论、计算机科学与 互联网络技术的迅速发展,家畜育种值估计的方
模型(Model)
模型是描述观察值与影响观察值变异性的各因子之间
的关系的数学方程式 分类
• 真实模型——非常准确地模拟观察值的变异性,
模型中不含有未知成分 • 理想模型——根据研究者所掌握的专业知识建立 的尽可能接近真实模型的模型 • 操作模型——用于实际统计分析的模型,它通常
是理想模型的简化形式
http://jpk.sicau.edu.cn/jcyzx/index.htm
线性模型的分类 固定效应模型(fixed model)
• 如一个模型中除了随机误差外,其余所有的效应均为
固定效应,则称此模型为固定效应模型或固定模型。
随机效应模型(random model)
• 若模型中除了总平均数外,其余的所有效应均为随机 效应,则称此模型为随机效应模型或随机模型
http://jpk.sicau.edu.cn/jcyzx/index.htm
经典的迭代方法
高斯-赛德尔迭代法 (gauss-seidel)
x
(k ) i
( ri c ij x
j 1 n
i 1
(k ) j
j i 1
c ij x j
n
( k 1 )
) c ii
雅可比迭代法(jacobi)
2 2 2
http://jpk.sicau.edu.cn/jcyzx/index.htm
混合模型方程组的度量
ˆ b C xx Var u 0 ˆ G C zz 0 C xz C zz
( u d a e ) / u
u G Var e 0
0 R
http://jpk.sicau.edu.cn/jcyzx/index.htm
BLUP 的统计特性
可估函数: b M u K
预测函数:L y
预测误差:K b M u L y
BLUP分析的实质是利用观察值的一个线性函数( L y )
1
•
如果个体父或母已知 p 为:
要加入的数值
0 .5 a ii
0 . 25 a ii
A 中的位置 ( p , i ), ( i , p ), ( q , i ), ( i , q ) ( p , p ), ( p , q ), ( q , p ), ( q , q )
http://jpk.sicau.edu.cn/jcyzx/index.htm
y 是所有观察值构成的向量
, , ,
b 是所有固定效应(包括)构成的向量
X 是固定效应的关联矩阵 u 是所有随机效应构成的向量 Z 是随机效应的关联矩阵 e 是随机残差向量 随机变量的数学期望: E ( b ) b E ( u ) 0 E ( e ) 0 E ( y ) Xb
方差-协方差矩阵结构:
殊情形。
随着计算机技术的高速发展,使这一方法的实际应用成为可能,目前 BLUP法已成为世界各国(尤其是发达国家)家畜遗传评定的规范方
法 。
http://jpk.sicau.edu.cn/jcyzx/index.htm
第二节
BLUP的基本原理
y Xb Zu e
一般混合模型可表示为:
分组 1 产 犊 季 节 初产年龄(等级) 1 114 150 109 2 163 117 103 2 143 3 145
数学方程式: y ijk a i b j eijk 期望和方差:E ( y ijk ) a i b j E ( eijk ) 0 2 假设和约束条件: V ( y ijk ) V ( e ijk ) i 所有母牛都来自同一品种 所有母牛都在相同的环境下以相同的饲养方式饲养 所有的母牛都来自同一公牛 所有的母牛的母亲对母牛的乳脂量无影响
l tt 1 l ti
2 i 1 p
p t 1
0 . 75 0 . 25 f p
个体的父母已知为 p 或 q ,假设 p q
0 . 5 ( l pi l qi ) l ti 0 . 5 l qi 0 i 1、
,这时:
2、 p q t 1
混合模型 (mixed model)
• 若模型中除了总平均数和随机误差之外,既含有固定
效应,也含有随机效应,则称之为混合模型
http://jpk.sicau.edu.cn/jcyzx/index.htm
传统的选择指数法的基本假设是不存在影响观察值的系统环境效应, 或者在使用前剔除了系统环境效应。 遗憾的是这个基本假设在几乎所有实际情况下都是不能成立的,如乳 用母牛饲养在管理条件不同的牛群中。 为克服以上缺陷,Henderson于1948年提出了BLUP方法,即最佳线性 无偏预测,这个统计方法可同时估计固定效应(例如系统环境效应) 和育种值。传统的选择指数是具有已知固定效应的BLUP方法的一种特
第三节
BLUP的计算技术
混合模型方程组的求解 经典解法
• 先求出方程组的系数矩阵和等式右边的向量,建立 方程组,然后迭代求解 • 缺点:混合模型方程组往往很大,容易受计算机内 存的限制,实际应用范围不广
间接解法
• 不需建立方程组,直接构建观测数据迭代公式,每 次迭代读入原始数据包括性状观测值和系谱记录, 并同时计算该次迭代的解 • 通用性不强,需要构建特定的数据迭代公式
法发生了根本的变化。
以Henderson为代表所发展起来的BLUP(Best
Linear Unbiased Prediction)育种值估计法,
将畜禽遗传育种的理论与实践带入了一个新的发 展阶段。
http://jpk.sicau.edu.cn/jcyzx/index.htm
第一节
线性模型基础知识
http://jpk.sicau.edu.cn/jcyzx/index.htm
因子
离散型
• • 通常表现为若干个有限的等级或水平 固定因子 ——有意识地抽取若干个特定的水平, 目的是对这些水平的效应进行估计或进行比较 , 如年效应 随机因子——因子的若干水平可看作是来自该因 子的所有水平所构成的总体的随机样本,目的是 要通过该样本去推断总体,如个体的遗传效应。
http://jpk.sicau.edu.cn/jcyzx/index.htm
混合模型方程组的一般形式
X R 1 X Z R 1 X ˆ b X R 1 y 1 1 Z R 1 y ˆ Z R Z G u X R Z
分子亲缘矩阵逆矩阵的计算
3. 令 D 为 L 对角线元素组成的对角阵,让 A 1 ( D 1 ) 2 4. 按以下规则加入已知父母的个体的有关元素构建 A 1 • 如果双亲已知为 p 和 q :
要加入的数值
0 .5 a ii
0 . 25 a ii
A 中的位置 ( p , i ), ( i , p ), ( q , i ), ( i , q ) ( p , p ), ( p , q ), ( q , p ), ( q , q )
t 1
http://jpk.sicau.edu.cn/jcyzx/index.htm
分子亲缘矩阵逆矩阵的计算
1. 构造所有个体的系谱列表 ,父母亲号先于个体号 2. 构建三角矩阵 L
个体 t 的父母未知时: l tt 1 i 1、 2、 t 1 l ti 0 个体 t 的父或母为 p 时: i 1、 2、 0 . 5 l pi l ti i p 1、 p 2、 0
2 2 2
i
ˆ b C xx Var u u C ˆ zx
ru uˆ
i i
ˆ Cov ( u i , u i )
u uˆ
i
1 du k
i
i
k e u
2
i
2
d u 为 C zz 中与 i 个体对应的对角线元素
http://jpk.sicau.edu.cn/jcyzx/index.htm
BLUP 估计一般方程
ˆ b ( X V
X) X V y 1 ˆ ˆ u G Z V (y X b )
1 1
BLUP法前提条件
1. 所用的表型信息必须真实可靠,系谱资料必须正确完
整 2. 所用的模型是真实模型;
3. 模型中的随机效应的方差组分或方差组分的比值已知
•
连续型
• 它呈现连续性变异,通常是作为影响观察值的协 变量(回归变量)
http://jpk.sicau.edu.cn/jcyzx/index.htm
线性模型(Linear model)
线性模型是指在模型中所包含的各个因子是 以相加的形式影响观察值,即它们与观察值
的关系为线性关系,但对于连续性的协变量
的父母未知时:
a ti a it 0
a ti a it 0 .5 a ip
i 1、 2、 t 1
个体 t 的父或母为 p 时 :
i 1、 2、 t 1
个体 t 的父母已知为 p 或 q 时:
a tt 1 0 . 5 a pq
i 1、 2、
a ti a it 0 . 5( a ip a iq )
对固定效应和随机效应的任意线性可估函数 ( K b M u )进行估计和预测,要求同时满足预测的 无偏性和预测误差方差最小(最佳)两个条件,由此得
u 到 b 的最佳线性无偏估计值(BLUE), 的最佳线性无
偏预测值(BLUP)。
http://jpk.sicau.edu.cn/jcyzx/index.htm
i p 1、 p 2、 i q 1、 q 2、
q 2
l tt
1 0 . 5 l pj l qj l ti
i 1 i 1
p
http://jpk.sicau.edu.cn/jcyzx/index.htm
0 . 5 0 . 25 ( f p f q )
(x
i 1
n
(t ) i
x
( t 1 ) i
)
2
( xi )
(t ) 2
http://jpk.sicau.edu.cn/jcyzx/index.htm
n
i 1
列表法计算分子亲缘矩阵
1.构造所有个体的系谱列表 ,父母亲号先于个体号
2.构建分子亲缘矩阵
个体 t
a tt 1 a tt 1
1
混合模型方程组的简化形式
X X Z X ˆ b X y 1 Z y Z Z k A u ˆ X Z
2
Var ( u ) G A u Var ( e ) R I e k e u