BLUP估计育种值

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
S ? ? M ? ? A2 ? ? D
个体间的加性遗传相关
?对于一个群体,如果我们将所有个体相互间的加性
遗传相关用一个矩阵表示出来,设群体中的个体为 1,
2,…,n,则这个矩阵为
?a11 a12 ? a1n ?
A=
??a12
a 22
?
a
2
n
? ?
? ? ? ? ??
??a1n
a2n
?
a
nn
? ?
—不存在系统环境效应 —个体随机来自同一总体 —各遗传参数事先已估计出来
? 在家畜育种实践中使用选择指数的
重要原则是满足第二个前提
关于BLUP育种值估计方法
BLUP产生和发展的背景
? 选择指数法在应用中获得较好的效果
? 选择指数法理论上的缺陷
? 1949年C.R. Henderson理论上提出BLUP
–用统计学方法对环境差异进行校正
? 场内测定 ? 估计育种值
育种值的估计
育种值估计方法:
?利用个体间的相似性,评定个体的遗传水平 ?育种值估计方法的效率,直接关系到是否更真
实地预测个体的遗传素质 ?育种值估计方法的效率,也关系到群体的遗传
进展和育种效益问题
选择指数法的基本要点
?当满足三个前提时,使用选择指数法, 可得到育种值的最佳线性预测(BLP)
?a11 a12 ? a1n ?
A=
??a12 ??
a 22 ?
? ?
a2
n
? ?
??
??a1n
a2n
?
a
nn
? ?
个体间的加性遗传相关
?分子亲缘相关矩阵:
aii ? 1 ? 0.5asidi
?a11 a12 ? a1n ?
A=
??a12 ??
a 22 ?
? ?
a2
n
? ?
??
??a1n
a2n
?
a
Var(x) =
V
?
??? 12
??
?
2 2
?
? ?
?
2n
? ?
??
?
?? 1n
? 2n
?
?
2 n
? ?
个体间的加性遗传相关
?个体 x和y间的加性遗传相关是指在它们的基因组中 具有同源相同基因的比例,或者说从个体 x的基因组中 随机抽取的一个基因在个体 y的基因组中也存在的概率
个体1 个体2
个体2
产犊季节、本身的遗传潜力、空怀天数等等
? 建立模型时需要考虑所有的影响因素 ? 建立线性模型是为了分析影响观察值的
各因素
因子的类型
根据因子的变异形式: ?因子可能是不连续变异的,或连续变异的 ?建模时也有时将连续变异的因素划分为等 级,例如头胎产犊年龄划为4级,即20-24、 25-28、29-32、>33月龄;
模型举例
设有肉牛 190~210日龄的体重资料,将日龄按每 5天 间隔分组, 190~210日龄就可分为 4组,欲分析不同 日龄组对体重的影响。可建立如下的线性模型 :
yij = ? + ai + eij
上式中:
yij :在第i个日龄组中的第 j头肉牛的体重,为可观
察的随机变量;
? :总平均数,是一个常量; ai :第i个日龄组的效应,它是固定效应; eij:剩余效应,也称为随机误差;
E( X ) ? ? xk pk k ?1
? 例如某城市有 10万个家庭, ? 没有孩子的家庭有 1000个, ? 有一个孩子的家庭有 9万个, ? 有两个孩子的家庭有 6000个, ? 有3个孩子的家庭有 3000个, ? 则此城市中任一个家庭中孩子的数目是一个随机
变量,记为 X,它可取值 0,1,2,3,其中取0的 概率为 0.01 ,取1的概率为 0.9,取 2的概率为 0.06 ,取 3的概率为 0.03 ,
Henderson
? 由于计算技术的滞后,限制了应用
? 20世纪70年代中期计算机技术的发展,为 BLUP在育种中 应用提供了可能
? 首先在奶牛育种中。而后在猪育种中应用
? 我国先后在奶牛和猪育种中得到应用
? BLUP计算机程序的研制
吴仲贤
BLUP的概念
?BLUP是一种统计方法,畜禽育种中适合应 用这一方法预测个体育种值,即遗传评定 (genetic evaluation)
?在同一个估计方程组中既完成固定效
应的估计,又能实现随机遗传效应的预 测,
关于BLUP的基础知识
数学期望的定义
设 X 为离散变量. 其分布为
P( X ? xk ) ? pk , k ? 1,2,?
??
若无穷级数 ? x k p k 则称 k ?1
其和为 X 的数学期望 记作 E( X ), 即
??
代数;
fA:为A的近交系数;
∑:表示当 x和y有多个共同祖先时要对所有连接 x 和y的通径求和
个体间的加性遗传相关
例: X
A
C
E
Y
B
D
? ? ? 解: axy ? 1 2 n1? n2 (1 ? f A )
X ? ? A? ?C ? ?B ? ?Y X ? ? A? ?C ? ? E ? ?D ? ?B ? ?Y
因子的类型
依据因子的性质:
?固定效应:所有可能出现的等级或水平都是
已知的,并且可以观察到的,例如:动物个 体的性别、年龄、泌乳胎次、牧场(饲养管 理体系)、畜舍、笼位、品种等等
?随机效应:随机地从一个无穷大的群体中抽
取的样本时,可能出现的水平
线性模型的概念
线性模型的内容:
?数学方程式,数学模型式 ?模型中随机效应和随机变量的数学期望和方差 ?建立模型时的所有假设和约束条件
一般分析:均数、方差等统计分布特征 特殊分析:遗传参数、个体育种值
?模型表达了数据的特性;反映了生物
学问题的的规律
模型的类型
有各种不同水平的模型:
━ 真实模型 :非常准确地模拟观察值的变异性,模 型中不含有未知成分
━理想模型 :根据研究者所掌握的专业知识建立的 尽可能接近真实模型的模型,但由于受到数据资 料的限制或过于复杂而不能用于实际分析。
? X的数学期望为 0×0.01+1×0.9+2×0.06+ 3×0.03等于1.11 ,即此城市一个家庭平均有小孩 1.11 个
? E(X)=1.11 。
定义 设连续 随机变量 X 的 概率函数 为
若广义积分
f(x)
??
?? ? xf ( x)dx
则称此积分为 X 的数学期望
记作 E( X ), 即
第五节 BLUP法估计育种值
数量性状的基本特征
?受遗传和环境的共同影响 ?受多个基因的作用 ?一般不能对单个基因进行分析
?绝大多数重要经济性状都是数量性状
育种值的概念
?个体作为亲本的种用价值(对后代的 遗传贡献)
?决定性状所有基因的平均效应总和
?衡量个体遗传素质的最主要指标 ?不能被观测,只能根据表观信息(表
nn
? ?
aij ? 0.5(ais j ? aid j )
asidi : 个体i的父亲与母亲之前的亲 缘相关
aisj : 个体i与j的父亲之前的亲缘相关 aid j : 个体i与j的母亲之前的亲缘相关
模型的定义
? 模型:科学合理地描述数据 ? 直接影响数据统计分析的效果 ? 数据:来自试验结果;来自调查测定结果 ? 数据统计分析:
线性模型的分类
⑶ 混合模型
y = Xb + Zu + e
ห้องสมุดไป่ตู้
(7-8)
y为所有观察值构成的向量
b为所有固定效应(包括 ?)构成的向量
X 为固定效应的关联矩阵 u为所有随机效应构成的向量 Z 为随机效应的关联矩阵 e为所有随机误差构成的向量
BLUP的概念
?BLUP = 最佳线性无偏预测
(Best Linear Unbiased Prediction ) ?最佳 - 估计误差最小,估计育种值与真实
型值)估计
遗传评估的概念
?评定个体单个或多个性状的遗传价值 ?测定个体在特定环境下的表现 ?科学、准确地选择种畜方法
?选种、选配的主要依据 ?育种工作的中心任务
遗传评估的方法
?使要评估的个体在相同的环境下进行比较 –将要评估的个体或其亲属(同胞和后裔) 集中在相对标准化的环境下进行性能测 定
? 性能测定站
这个矩阵称为加性遗传相关矩阵( Additive genetic relationship matrix )或分子亲缘相关 矩阵(numerator relationship matrix)
个体间的加性遗传相关
?分子亲缘相关矩阵:画出完整图谱
? ? ? axy ? 1 2 n1? n2 (1 ? f A )
y
22
? ?
y ? ?y23 ? ,
?1 ? X ? ?1
0 0
1 1
0 0
0? ?
0? ,
??a1
? ?
a ? ?a2 ? ,
??e22
? ?
e ? ?e23 ?
? ?
y31
? ?
? y32 ?
?1 0 0 1 0?
?
?
?1 0 0 1 0?
??a3
? ?
?a4 ?
??e31
? ?
?e32 ?
? ?
y33
? ?
??1 0 0 1 0??
??e33
? ?
? y41 ?
? ?
y
42
? ?
?1 0 0 0 1? ??1 0 0 0 1??
?e41 ?
??e42
? ?
y = Xa + e E(e) = 0,E(y) = Xa Var(y) = Var(e) = Iσ2
矩阵 X称为关联矩阵,
因为其中的元素指示
个体1
个体3
同卵双生: 个体间基因完全相同
a12 ? 1
亲子: 个体间基因一半相同
a12 ? 0.5
半同胞: 个体间基因1/4相同
a23 ? 0.25
个体间的加性遗传相关
?个体 x和y间拥有多个共同祖先
A1
A2
? ? ? axy ? 1 2 n1? n2 (1 ? f A )
个体X
个体Y
n1和n2:分别为由个体 x和y到它们的共同祖先 A的世
了y中的元素与 a中的 元素的关联情况, I是
单位矩阵。
线性模型的分类
⑴ 固定效应模型 ? 如一个模型中除了随机误差外,其余所有的效应
均为固定效应,则称此模型为固定效应模型,或 固定模型( fixed model )。 ⑵ 随机效应模型 ? 若模型中除了总平均μ外,其余的所有效应均为 随机效应,则称此模型为随机效应模型,或随机 模型(random model )。 ⑶ 混合模型 ? 若模型中除了总平均μ和随机误差之外,既含有 固定效应,也含有随机效应,则称之为混合模型 (mixed model )。
━ 操作模型 :用于实际统计分析的模型,它通常是 理想模型的简化形式
线性模型的概念
观察值(记录):由试验单位上(个体)直接 测量的结果,不管是由客观地还是主管地获得 测量结果。
?观察值一般都是具有多元分布的随机变量
?当分布的形式已知,则需要详尽地了解分布 的参数
线性模型的概念
因子:直接或间接影响观察值的因素 例如:影响母牛产奶的因素有:头胎产犊年龄、
模型举例
上式中随机变量的期望和方差及协方差为 :
E(eij) = 0,E(yij) = ? + ai , Var(yij) = Var( eij) = σ2
Cov(eij,eij')= Cov( eij,ei'j)= Cov( eij,ei'j')=0
此模型的假设和约束条件包括: 1) 所有犊牛都来自同一品种 , 2) 母亲的年龄对犊牛体重无影响 , 3) 犊牛的性别相同或性别对体重无影响 , 4) 所有犊牛都在相同的环境下以相同的饲养方式饲养
? 应用BLUP法进行种畜遗传评定,可以提高 选种的准确性,进而加快群体的遗传进展
? 应用BLUP的效果除了取决于方法本身因素 外,还受综合育种措施,诸如性能测定、 种群结构、选配计划等多项因素的影响。
BLUP法的基础
?统计学意义 :将观察值表示成固定效应、随机效 应和随机残差的线性组合
?遗传学意义 :将表型值表示成遗传效应、系统环 境效应(如畜群、年度、季节、性别等)、随机 环境效应(如窝效应、永久环境效应)和剩余效 应(包括部分遗传效应和环境效应)的线性组合
??
E ( X ) ? ??? xf ( x)dx
数学期望的本质 —— 加权平均
随机向量,期望向量 和方差-协方差矩阵
随机向量,期望向量 和方差-协方差矩阵
?x1 ?
??1 ?
x
?
??x2
? ?
? ??
E(x )

?
???
2
? ?
? ??
??xn
? ?
???
n
? ?
??
2 1
? 12
? ? 1n ?
模型举例
现有一数据表
每一观察值都可根据上面的模型建立一个方程式:
? y11 ?
?1 1 0 0 0?
?e11 ?
? ?
y12
? ?
??1 1 0 0 0??
??e12
? ?
? y13 ?
? ?
y21
? ?
?1 1 0 0 0?
?e13 ?
??1 0 1 0 0??
?? ?
??e21
? ?
? ?
axy ? (1/ 2)2? 2 ? (1/ 2)3?3
个体间的加性遗传相关
例:
aSD ? ?
解:
? ? ? aSD ? 1 2 n1? n2 (1 ? fA )
S ? ? G ? ? A2 ? ? M ? ? D
S ? ? G ? ? Da ? ? A1 ? ? C2 ? ? Ca ? ? D S ? ? M ? ? M '? ? A1 ? ? C2 ? ?Ca ? ? D
相关文档
最新文档