BLUP育种值估计 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

混合模型方程组的简化形式混合模型方程组的简化形式
X ′X Z ′X ˆ b X ′y = − 1 Z ′y Z ′Z + kA u ˆ X ′Z
Var (u ) = G = Aσ u2 Var ( e ) = R = Iσ e2 k = σ e2 σ u2
方差-协方差矩阵结构：方差-协方差矩阵结构：
u G Var = e 0
0 R
http://jpk.sicau.edu.cn/jcyzx/index.htm
BLUP 的统计特性可估函数： ′b + M ′u K 预测函数：L′y 预测误差：K ′b + M ′u − L′y
http://jpk.sicau.edu.cn/jcyzx/index.htm
线性模型举例
母牛的乳脂量生产成绩表（Schaeffer L R，1993）
分组初产年龄（等级）初产年龄（等级） 1 1 114 150 109 2 163 117 103 2 143 3 145
产犊季节
数学方程式：数学方程式： yijk = µ + ai + b j + eijk 期望和方差：期望和方差：E ( y ijk ) = µ + ai + b j E (eijk ) = 0 假设和约束条件：假设和约束条件： V ( yijk ) = V (eijk ) = σ i2 所有母牛都来自同一品种所有母牛都在相同的环境下以相同的饲养方式饲养所有的母牛都来自同一公牛所有的母牛的母亲对母牛的乳脂量无影响
http://jpk.sicau.edu.cn/jcyzx/index.htm
线性模型的分类固定效应模型（fixed model）
• 如一个模型中除了随机误差外，其余所有的效应均为固定效应，则称此模型为固定效应模型或固定模型。
随机效应模型（random model）
• 若模型中除了总平均数外，其余的所有效应均为随机效应，则称此模型为随机效应模型或随机模型
http://jpk.sicau.edu.cn/jcyzx/index.htm
混合模型方程组的度量混合模型方程组的度量
ˆ b C xx Var = u 0 ˆ G − C zz 0
ˆ b C xx C xz = Var u − u C C zz ˆ zx ˆ Cov (ui , ui ) ru uˆ = = (σ u2 − d a σ e2 ) / σ u2 = 1 − d u k
2 ltt = 1 − ∑ lti = 0.75 − 0.25 f p
p
个体的父母已知为 p 或 q ，假设 p < q
i =1
，这时：
0.5(l pi + lqi ) lti = 0.5lqi 0
p q i =1 i =1
i = 1、
2、
⋯ p
i = p + 1、 p + 2、 ⋯ q i = q + 1、 q + 2、 ⋯ t − 1
http://jpk.sicau.edu.cn/jcyzx/index.htm
第二节
BLUP的基本原理 BLUP的基本原理
y = Xb + Zu + e
一般混合模型可表示为：一般混合模型可表示为：
，，，
y 是所有观察值构成的向量 b 是所有固定效应（包括）构成的向量 X 是固定效应的关联矩阵 u 是所有随机效应构成的向量 Z 是随机效应的关联矩阵 e 是随机残差向量随机变量的数学期望： E ( b ) = b E (u ) = 0 E ( e ) = 0 E ( y ) = Xb 随机变量的数学期望：
att = 1
ati = ait = 0.5aip i = 1、 2、 ⋯ t − 1 个体 t 的父母已知为 p 或 q 时：
att = 1+ 0.5a pq ati = ait = 0.5( aip + aiq ) i = 1、 2、 ⋯ t − 1
http://jpk.sicau.edu.cn/jcyzx/index.htm
间接解法
• 不需建立方程组，直接构建观测数据迭代公式，每次迭代读入原始数据包括性状观测值和系谱记录，并同时计算该次迭代的解 • 通用性不强，需要构建特定的数据迭代公式
http://jpk.sicau.edu.cn/jcyzx/index.htm
经典的迭代方法
高斯-赛德尔迭代法（gauss-seidel）
http://jpk.sicau.edu.cn/jcyzx/index.htm
第一节
线性模型基础知识
模型（Model）模型（Model）模型是描述观察值与影响观察值变异性的各因子之间的关系的数学方程式分类 • 真实模型——非常准确地模拟观察值的变异性，模型中不含有未知成分 • 理想模型——根据研究者所掌握的专业知识建立的尽可能接近真实模型的模型 • 操作模型——用于实际统计分析的模型，它通常是理想模型的简化形式
•
连续型
• 它呈现连续性变异，通常是作为影响观察值的协变量（回归变量）
http://jpk.sicau.edu.cn/jcyzx/index.htm
线性模型（ model）线性模型（Linear model）
线性模型是指在模型中所包含的各个因子是以相加的形式影响观察值，即它们与观察值的关系为线性关系，但对于连续性的协变量也允许出现平方或立方项。一个线性模型应由3个部分组成： 1. 数学方程式 2. 方程式中随机变量的期望和方差及协方差 3. 假设、约束和限制条件
xi( improved ) = xi( k ) + ω ( xi( k ) − xi( k −1) )
收敛标准（收敛标准（convergence criteria)
一般标准 max x ( t ) − x ( t −1) < ε i i 改进标准
∑ (x
i =1
n
(t ) i
−x
( t −1) 2 i
分子亲缘矩阵逆矩阵的计算
1. 构造所有个体的系谱列表，父母亲号先于个体号 2. 构建三角矩阵 L 个体 t 的父母未知时：
ltt = 1 lti = 0 i = 1、 2、 ⋯ t − 1
个体 t 的父或母为
0.5l pi lti = 0
p 时：
i = 1、 2、 ⋯ p i = p + 1、 p + 2、 ⋯ t − 1
BLUP分析的实质是利用观察值的一个线性函数（ L′y ）对固定效应和随机效应的任意线性可估函数（ K ′b + M ′u ）进行估计和预测，要求同时满足预测的无偏性和预测误差方差最小（最佳）两个条件，由此得
u 最佳线性无到 b 的最佳线性无偏估计值最佳线性无偏估计值（BLUE），的最佳线性无最佳线性无偏估计值
)
( xi( t ) ) 2 < ε ∑
http://jpk.sicau.edu.cn/jcyzx/index.htm
n
i =1
列表法计算分子亲缘矩阵 1.构造所有个体的系谱列表，父母亲号先于个体号 2.构建分子亲缘矩阵
个体 t 的父母未知时：
i = 1、 2、 ⋯ t − 1 att = 1 ati = ait = 0 个体 t 的父或母为 p 时：
http://jpk.sicau.edu.cn/jcyzx/index.htm
混合模型方程组的一般形式混合模型方程组的一般形式
X ′R −1 X Z ′R −1 X ˆ X ′R −1 Z b X ′R −1 y = −1 − 1 Z ′R −1 y ˆ Z ′R Z + G u
x
(k ) i
= ( ri − ∑ cij x
j =1 n
i −1
(k ) j
−
j =i +1
cij x (j k −1) ) cii ∑
n
雅可比迭代法（jacobi）
x
(k ) i
= ( ri − ∑ cij x (j k −1) ) cii + xi( k −1)
j =1
松弛迭代法（relaxation）
i i
σ u σ uˆ
i
i
i
i
k = σ e2 σ u2
d u 为 C zz 中与 i 个体对应的对角线元素
i
http://jpk.sicau.edu.cn/jcyzx/index.htm
ຫໍສະໝຸດ Baidu
第三节
BLUP的计算技术 BLUP的计算技术
混合模型方程组的求解经典解法
• 先求出方程组的系数矩阵和等式右边的向量，建立方程组，然后迭代求解 • 缺点：混合模型方程组往往很大，容易受计算机内存的限制，实际应用范围不广
http://jpk.sicau.edu.cn/jcyzx/index.htm
因子离散型
• • 通常表现为若干个有限的等级或水平固定因子 ——有意识地抽取若干个特定的水平，目的是对这些水平的效应进行估计或进行比较，如年效应随机因子——因子的若干水平可看作是来自该因子的所有水平所构成的总体的随机样本，目的是要通过该样本去推断总体，如个体的遗传效应。
混合模型（mixed model）
• 若模型中除了总平均数和随机误差之外，既含有固定效应，也含有随机效应，则称之为混合模型
http://jpk.sicau.edu.cn/jcyzx/index.htm
传统的选择指数法的基本假设是不存在影响观察值的系统环境效应，传统的选择指数法的基本假设是不存在影响观察值的系统环境效应，不存在影响观察值的系统环境效应或者在使用前剔除了系统环境效应。或者在使用前剔除了系统环境效应。在使用前剔除了系统环境效应遗憾的是这个基本假设在几乎所有实际情况下都是不能成立的，遗憾的是这个基本假设在几乎所有实际情况下都是不能成立的，如乳几乎所有实际情况下都是不能成立的用母牛饲养在管理条件不同的牛群中。用母牛饲养在管理条件不同的牛群中。为克服以上缺陷，Henderson于1948年提出了BLUP方法，即最佳线性为克服以上缺陷，Henderson于1948年提出了BLUP方法，年提出了BLUP方法无偏预测，这个统计方法可同时估计固定效应（例如系统环境效应）无偏预测，这个统计方法可同时估计固定效应（例如系统环境效应）和育种值。传统的选择指数是具有已知固定效应的BLUP方法的一种特和育种值。传统的选择指数是具有已知固定效应的BLUP方法的一种特 BLUP 殊情形。殊情形。随着计算机技术的高速发展，使这一方法的实际应用成为可能，随着计算机技术的高速发展，使这一方法的实际应用成为可能，目前 BLUP法已成为世界各国（尤其是发达国家）家畜遗传评定的规范方 BLUP法已成为世界各国（尤其是发达国家）家畜遗传评定的规范方法已成为世界各国法。
第一节线性模型基础知识第二节 BLUP的基本原理第三节 BLUP的计算技术第四节育种值估计模型第五节多性状BLUP 法的基本原理第六节 BLUP育种值估计举例第七节 BLUP育种值估计软件
随着数理统计学与线性模型理论、随着数理统计学与线性模型理论、计算机科学与互联网络技术的迅速发展，互联网络技术的迅速发展，家畜育种值估计的方法发生了根本的变化。法发生了根本的变化。以Henderson为代表所发展起来的BLUP（Best Henderson为代表所发展起来的BLUP（为代表所发展起来的BLUP Prediction）育种值估计法， Linear Unbiased Prediction）育种值估计法，将畜禽遗传育种的理论与实践带入了一个新的发展阶段。展阶段。
偏预测值（BLUP）偏预测值（BLUP）。
http://jpk.sicau.edu.cn/jcyzx/index.htm
BLUP 估计一般方程
ˆ b = (X ′V −1 X)− X ′V −1 y ˆ ˆ u = GZ ′V −1 (y − Xb)
BLUP法前提条件 BLUP法前提条件
1. 所用的表型信息必须真实可靠，系谱资料必须正确完整 2. 所用的模型是真实模型； 3. 模型中的随机效应的方差组分或方差组分的比值已知