基因组选择

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

候 选 群 体

获得预测方程
群 体
估计标记效应
在参考群中估计标记效应gi
y = µ1n + X i gi + e
设计矩阵 染色体片断遗传效应
计算基因组育种值(gEBV) 计算基因组育种值(gEBV)
在候选群体中计算个体gEBV 在候选群体中计算个体gEBV
全部基因组染色体片断
gEBV = ∑i =1 Xig i
Bayes' theorem with continuous prior and posterior distributions
to get the posterior probability distribution, multiply the prior probability distribution by the likelihood function and then normalize.
121101011110 111211120200 101121101111 122221121111 101101111102 011111012011 121120011010
Bayes formula
P(A) is the prior probability or marginal probability of A P(A|B) is the conditional probability of A, given B. It is also called the posterior probability because it is derived from or depends upon the specified value of B. P(B|A) is the conditional probability of B given A. It is also called the likelihood. P(B) is the prior or marginal probability of B, and acts as a normalizing constant.
p
设计矩阵
染色体片断效应

基因组育种值
Chr 1
+ 40 + 20
Chr 2
Chr 3
...... Chr n
SNP effect
- 00 - 20 - 40
Known SNPs
ˆ gEBV = ∑ Xi gi
i =1
n
Number of SNPs SNP allele effect
1 + 1 - 1 - 1 + 1 + 25 - 1 + 1 - 1 - 1 - 1 + 42 + 1 - 1 - 1 - 1 - 1 - 22 - 1 + 1 1 - 1 = +38
BLUP method (4)
y = Wf + Za + e
2 Var (a) = Gσ a
Genomic relationship matrix
ˆ W′Z f W′y W′W Z′W Z′Z + Gk = Z′y ˆ a
Genotype Pedigree
基因组选择
• 基本步骤
1. 利用一个参考群体估计每个SNP的效应 – 参考群体:每个个体都有性状表型记录 和所有SNP基因型 2. 利用SNP效应估计值计算候选群体的个体 基因组育种值 – 候选群体:每个个体都有所有SNP基因型
基因组选择
参 考 群 体
性状表型 SNP基因型 基因型 SNP基因型 基因型
y = Xβ源自文库+ Zu + e
ˆ X 'Z X ' X β X ' y Z ' X Z ' Z + σ 2 σ 2 A−1 = Z ' y ˆ e a u y:表型信息
A:系谱信息
常规遗传评估技术
• 对很多重要经济性状十分有效
12
First lactation yield (1000 kg)
y = µ1n + ∑ X i gi + e
不足: 不足: 1. 难以确定模型选择的阈值 2. 容易高估标记效应
BLUP方法1
BLUP method (1)
y = Wf + ∑ X j g j + e
j =1
n
gj= chromosomal segment effect
2 Var (g j ) = Iσ g
Bayesian inference
refers to the use of a prior probability over hypotheses to determine the likelihood of a particular hypothesis given some observed evidence; that is, the likelihood that a particular hypothesis is true sogiven some observed evidence (the so-called posterior probability of the hypothesis) comes from a combination of probability) the inherent likelihood (or prior probability) of the hypothesis and the compatibility of the observed evidence with the hypothesis (or likelihood of the evidence).
1000111220020012111011112111101111001121100020122002220111 1202101200211122110021112001111001011011010220011002201101 1200201101020222121122102010011100011220221222112021120120 2010020220200002110001120201122111211102201111000021220200 0221012020002211220111012100111211102112110020102100022000 2201000201100002202211022112101121110122220012112122200200 0200202020122211002222222002212111121002111120011011101120 0202220001112011010211121211102022100211201211001111102111 2110211122000101101110202200221110102011121111011202102102 1211011022122001211011211012022011002220021002110001110021 1021101110002220020221212110002220102002222121221121112002 0110202001222222112212021211210110012110110200220002001002 0001111011001211021212111201010121202210101011111021102112 2111111212111210110120011111021111011111220121012121101022 202021211222120222002121210121210201100111222121101
假设所有染色体片段具有相同的效应方差! 假设所有染色体片段具有相同的效应方差
ˆ W′X f W′y WW X′W X′X + Iλ = X′y ˆ g
How to chose ?
2 σg
2 λ = σ e2 σ g
BLUP方法2
BLUP method (2)
Function
σ 2 = σ 2 ×1 j
σ 2 =σ 2 × sj ˆ j
σ = σ ×1.12
2 j 2 sj ˆ sj ˆ
σ = σ ×1.25
2 j 2
σ 2 = σ 2 × s2 ˆj j
ˆ sj
is standardised effect estimate of marker j
BLUP方法4
y = Wf + Za + ∑ X j g j + e
j =1 n
a = residual polygenic effect
2 Var (a) = Aσ a
W′Z W′W Z′W Z′Z + A −1k X′W X′Z
ˆ W′X f W′y a = Z′y Z′X ˆ X′X + Iλ g X′y ˆ
• 这些基因或标记仅能解释有限的遗传变异
– (10 ~30% 遗传变异) 遗传变异)
基因组选择 (GS)
• Meuwissen(2001)等首次提出了基因组选择 ,但在当时并未引起重视 • Schafferr(2006)重新指出GS在奶牛育种中 的巨大应用价值 • GS成为当期家畜育种最热门的研究领域 • 优势:
y = X β + Mg + Zu + e
y:表型信息 A:系谱信息 M: 标记信息 g:可作为固定和随机效应
标记辅助选择(MAS) 标记辅助选择(MAS)
• 应用现状 – 实际应用不多 – 应用效果不显著 – 主要原因: 主要原因:
• 已被证实具有显著效应的基因或标记有限
– (发现并证实一个有效的基因需要很长的时间和 很高的成本) 很高的成本)
Milk yield in US Holsteins 美国荷斯坦奶牛产奶量表型及遗传进展
11 10
加拿大猪100kg体重日龄遗传进展
Phenotypic
9 8 7 6 1960
Genetic
1970
1980
Birth year
1990
2000
常规遗传评估技术
• 局限性
– 当性状表型难以获取或遗传力低时,遗传评估 当性状表型难以获取或遗传力低时, 可靠性不高 – 不能进行早期遗传评估
基因组时代的 动物遗传评估技术
遗传评估
• • • 评估和比较动物个体在遗传上的优劣 为选择优秀种用个体提供依据 动物育种的中心工作
表现型=基因型+ 表现型=基因型+环境
常规遗传评估技术
选择
基因 黑箱) (黑箱)
表型
遗传评估
环境
亲属的表型
特点: 特点:利用表型进行遗传评估
常规遗传评估技术
• BLUP方法是常规遗传评估技术的核心 方法是常规遗传评估技术的核心
标记效应的估计方法
最小二乘法 BLUP 贝叶斯方法
BayesA, B, C
其他方法
半参数、 半参数、非参数 机器学习、 机器学习、主成份分析
最小二乘法
对标记效应分布无任何假设 1: 对每个标记作单点回归分析
y = µ1n + Xg + e
选择效应值最大的m个点放入模型中, 2: 选择效应值最大的m个点放入模型中,同时对其 进行估计
标记辅助选择(MAS)
基因
表型数据
选择
(黑箱) 黑箱)
分子遗传学
遗传评估 基因信息
主效基因 /QTL
特点: 特点:利用表型和部分基因的信息进行遗传评估
基因辅助选择(GAS)
• 氟烷基因
y = Xg + e
连锁不平衡标记辅助选择(LD-MAS) 连锁不平衡标记辅助选择(LD-MAS)
MA-BLUP: 遗传评估技术 - MA-BLUP:
BLUP方法3
BLUP method (3)
n
y = Wf + ∑ X j g j + e
j =1
Var(g j ) = Iσ
2 j
每个染色体片段有自己的效应方差! 每个染色体片段有自己的效应方差!
改变染色体片段效应的方法
Model variant
linear weight (LW) exponential weight (E1, USDA) exponential weight (E2, USDA) quadratic weight (Q1) quadratic weight with limits (Q2)
– 可以捕获所有的遗传变异 – 无需表型信息即可进行遗传评估,极大地缩短 无需表型信息即可进行遗传评估, 世代间隔和育种成本
基因组选择
• 利用覆盖全基因组的高密度标记(SNP)进 行个体遗传评估
基因 黑箱) (黑箱)
标记信息
新的标 记(黑 箱)
估计基因组育种值
全基因组SNP芯片 全基因组SNP芯片 SNP
Year
Human Poultry Bovine Pig Sheep 2008 2005 2007 2008 2007
No. SNP
3,000,000 2,800,000 ~2,000,000 ~2,000,000 -
Chips
1000k 60K 54k 60k 50k
用于遗传评估的数据
用于遗传评估的数据
相关文档
最新文档