第7章BLUP估计育种值

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机效应:随机地从一个无穷大的群体中抽
取的样本时,可能出现的水平
线性模型的概念
线性模型的内容:
数学方程式,数学模型式 模型中随机效应和随机变量的数学期望和方差 建立模型时的所有假设和约束条件
模型举例
设有肉牛190~210日龄的体重资料,将日龄按每5天 间隔分组,190~210日龄就可分为4组,欲分析不同 日龄组对体重的影响。可建立如下的线性模型:
e33

y41

y42

1 0 0 0 1 1 0 0 0 1
e41
e42

y = Xa + e E(e) = 0,E(y) = Xa Var(y) = Var(e) = Iσ2
矩阵X称为关联矩阵,
因为其中的元素指示
了y中的元素与a中的 元素的关联情况,I是
个体间的加性遗传相关
例:
aSD ?
解:
aSD 1 2 n1n2 (1 fA )
S G A2 M D S G Da A1 C2 Ca D S M M' A1 C2 Ca D S M A2 D
k 1
• 例如某城市有10万个家庭, • 没有孩子的家庭有1000个, • 有一个孩子的家庭有9万个, • 有两个孩子的家庭有6000个, • 有3个孩子的家庭有3000个, • 则此城市中任一个家庭中孩子的数目是一个随机
变量,记为X,它可取值0,1,2,3,其中取0的 概率为0.01,取1的概率为0.9,取2的概率为 0.06,取3的概率为0.03,
Henderson
由于计算技术的滞后,限制了应用
20世纪70年代中期计算机技术的发展,为BLUP在育种中 应用提供了可能
首先在奶牛育种中。而后在猪育种中应用
我国先后在奶牛和猪育种中得到应用
BLUP计算机程序的研制
吴仲贤
BLUP的概念
BLUP是一种统计方法,畜禽育种中适合应 用这一方法预测个体育种值,即遗传评定 (genetic evaluation)
模型的定义
模型:科学合理地描述数据 直接影响数据统计分析的效果 数据:来自试验结果;来自调查测定结果 数据统计分析:
一般分析:均数、方差等统计分布特征 特殊分析:遗传参数、个体育种值
模型表达了数据的特性;反映了生物
学问题的的规律
模型的类型
有各种不同水平的模型:
━真实模型:非常准确地模拟观察值的变异性,模 型中不含有未知成分
个体间的加性遗传相关
对于一个群体,如果我们将所有个体相互间的加性 遗传相关用一个矩阵表示出来,设群体中的个体为1,
2,…,n,则这个矩阵为
a11 a12 a1n
A=
a12
a22

a
2n


a1n
a2n

ann
这个矩阵称为加性遗传相关矩阵(Additive genetic relationship matrix)或分子亲缘相关 矩阵(numerator relationship matrix)
育种值的相关最大 线性 - 估计是基于线性模型(估计值与观
察值乘线性关系) 无偏 - 估计值的估计不受非遗传因素影响 预测 - 预测一个个体将来作为亲本的种用
a12 1
亲子: 个体间基因一半相同
a12 0.5
半同胞: 个体间基因1/4相同
a23 0.25
个体间的加性遗传相关
个体x和y间拥有多个共同祖先
A1
A2
axy 1 2 n1n2 (1 fA )
个体X
个体Y
n1和n2:分别为由个体x和y到它们的共同祖先A的世
代数;
fA:为A的近交系数;
∑:表示当x和y有多个共同祖先时要对所有连接x 和y的通径求和
个体间的加性遗传相关
例: X
Y
A
C
E
B
D
解: axy 1 2 n1n2 (1 fA )
X A C B Y X A C E D B Y
axy (1/ 2)22 (1/ 2)33
Cov(eij,eij')= Cov(eij,ei'j)= Cov(eij,ei'j')=0
此模型的假设和约束条件包括: 1) 所有犊牛都来自同一品种, 2) 母亲的年龄对犊牛体重无影响, 3) 犊牛的性别相同或性别对体重无影响, 4) 所有犊牛都在相同的环境下以相同的饲养方式饲养
模型举例
现有一数据表
个体间的加性遗传相关
分子亲缘相关矩阵:画出完整图谱
axy 1 2 n1n2 (1 fA )
a11 a12 a1n
A= a12
a22

a2
n


a1n
a2n

a
nn

个体间的加性遗传相关
分子亲缘相关矩阵:
aii 1 0.5asidi
1 X 1
0 0
1 1
0 0
0
0 ,

a1

a a2 ,
e22

e e23

y31

y32
1 0 0 1 0


a3

e31

1 0 0 1 0
a4
e32

y33

1 0 0 1 0



1n
2n


2 n

个体间的加性遗传相关
个体x和y间的加性遗传相关是指在它们的基因组中 具有同源相同基因的比例,或者说从个体x的基因组中 随机抽取的一个基因在个体y的基因组中也存在的概率
个体1 个体2
个体2
个体1
个体3
同卵双生: 个体间基因完全相同
数学期望的本质 —— 加权平均
随机向量,期望向量 和方差-协方差矩阵
随机向量,期望向量 和方差-协方差矩阵
x1
1
x


x
2


E(x)



2



x
n


n

Var(x) = V 1122
12
ቤተ መጻሕፍቲ ባይዱ
2 2


1n 2n
—不存在系统环境效应 —个体随机来自同一总体 —各遗传参数事先已估计出来
在家畜育种实践中使用选择指数的
重要原则是满足第二个前提
关于BLUP育种值估计方法
BLUP产生和发展的背景
选择指数法在应用中获得较好的效果
选择指数法理论上的缺陷
1949年C.R. Henderson理论上提出BLUP
━理想模型:根据研究者所掌握的专业知识建立的 尽可能接近真实模型的模型,但由于受到数据资 料的限制或过于复杂而不能用于实际分析。
━操作模型:用于实际统计分析的模型,它通常是 理想模型的简化形式
线性模型的概念
观察值(记录):由试验单位上(个体)直接 测量的结果,不管是由客观地还是主管地获得 测量结果。
观察值一般都是具有多元分布的随机变量 当分布的形式已知,则需要详尽地了解分布 的参数
线性模型的概念
因子:直接或间接影响观察值的因素 例如:影响母牛产奶的因素有:头胎产犊年龄、
产犊季节、本身的遗传潜力、空怀天数等等
建立模型时需要考虑所有的影响因素 建立线性模型是为了分析影响观察值的
各因素
应用BLUP法进行种畜遗传评定,可以提高 选种的准确性,进而加快群体的遗传进展
应用BLUP的效果除了取决于方法本身因素 外,还受综合育种措施,诸如性能测定、 种群结构、选配计划等多项因素的影响。
BLUP法的基础
统计学意义:将观察值表示成固定效应、随机效 应和随机残差的线性组合
遗传学意义:将表型值表示成遗传效应、系统环 境效应(如畜群、年度、季节、性别等)、随机 环境效应(如窝效应、永久环境效应)和剩余效 应(包括部分遗传效应和环境效应)的线性组合
型值)估计
遗传评估的概念
评定个体单个或多个性状的遗传价值 测定个体在特定环境下的表现 科学、准确地选择种畜方法
选种、选配的主要依据 育种工作的中心任务
遗传评估的方法
使要评估的个体在相同的环境下进行比较 –将要评估的个体或其亲属(同胞和后裔) 集中在相对标准化的环境下进行性能测 定
性能测定站
因子的类型
根据因子的变异形式: 因子可能是不连续变异的,或连续变异的 建模时也有时将连续变异的因素划分为等 级,例如头胎产犊年龄划为4级,即20-24、 25-28、29-32、>33月龄;
因子的类型
依据因子的性质:
固定效应:所有可能出现的等级或水平都是
已知的,并且可以观察到的,例如:动物个 体的性别、年龄、泌乳胎次、牧场(饲养管 理体系)、畜舍、笼位、品种等等
线性模型的分类
⑶ 混合模型
y = Xb + Zu + e
(7-8)
y为所有观察值构成的向量
b为所有固定效应(包括)构成的向量
X为固定效应的关联矩阵 u为所有随机效应构成的向量 Z为随机效应的关联矩阵 e为所有随机误差构成的向量
BLUP的概念
BLUP = 最佳线性无偏预测
(Best Linear Unbiased Prediction) 最佳 - 估计误差最小,估计育种值与真实
第五节 BLUP法估计育种值
数量性状的基本特征
受遗传和环境的共同影响 受多个基因的作用 一般不能对单个基因进行分析
绝大多数重要经济性状都是数量性状
育种值的概念
个体作为亲本的种用价值(对后代的 遗传贡献)
决定性状所有基因的平均效应总和
衡量个体遗传素质的最主要指标 不能被观测,只能根据表观信息(表
a11 a12 a1n
A= a12
a22

a2
n


a1n
a2n

a
nn

aij 0.5(ais j aid j )
asidi : 个体i的父亲与母亲之前的亲 缘相关
aisj : 个体i与j的父亲之前的亲缘相关 aid j : 个体i与j的母亲之前的亲缘相关
每一观察值都可根据上面的模型建立一个方程式:
y11

y12

1 1 0 0 0 1 1 0 0 0
e11

e12


y13 y21

1 1 0 0 0 1 0 1 0 0

ee1231


y22

y y23 ,
• X的数学期望为0×0.01+1×0.9+2×0.06+ 3×0.03等于1.11,即此城市一个家庭平均有小孩 1.11个
• E(X)=1.11。
定义 设连续 随机变量 X 的 概率函数 为
若广义积分
f (x)

xf (x)dx
则称此积分为 X 的数学期望
记作 E( X ), 即

E( X ) xf (x)dx
在同一个估计方程组中既完成固定效
应的估计,又能实现随机遗传效应的预 测,
关于BLUP的基础知识
数学期望的定义
设 X 为离散变量. 其分布为
P( X xk ) pk , k 1,2,

若无穷级数 xk pk 则称
k 1
其和为 X 的数学期望 记作 E( X ), 即

E( X ) xk pk
–用统计学方法对环境差异进行校正
场内测定 估计育种值
育种值的估计
育种值估计方法:
利用个体间的相似性,评定个体的遗传水平 育种值估计方法的效率,直接关系到是否更真
实地预测个体的遗传素质 育种值估计方法的效率,也关系到群体的遗传
进展和育种效益问题
选择指数法的基本要点
当满足三个前提时,使用选择指数法, 可得到育种值的最佳线性预测(BLP)
yij = + ai + eij
上式中:
yij :在第i个日龄组中的第j头肉牛的体重,为可观
察的随机变量;
:总平均数,是一个常量; ai :第i个日龄组的效应,它是固定效应; eij:剩余效应,也称为随机误差;
模型举例
上式中随机变量的期望和方差及协方差为:
E(eij) = 0,E(yij) = + ai , Var(yij) = Var(eij) = σ2
单位矩阵。
线性模型的分类
⑴ 固定效应模型 • 如一个模型中除了随机误差外,其余所有的效应
均为固定效应,则称此模型为固定效应模型,或 固定模型(fixed model)。 ⑵ 随机效应模型 • 若模型中除了总平均μ外,其余的所有效应均为 随机效应,则称此模型为随机效应模型,或随机 模型(random model)。 ⑶ 混合模型 • 若模型中除了总平均μ和随机误差之外,既含有 固定效应,也含有随机效应,则称之为混合模型 (mixed model)。
相关文档
最新文档