1 张勤 动物基因组选择
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
...... Chr n
SNP 效应
+ 20 - 00 - 20 - 40
已知的SNPs
ห้องสมุดไป่ตู้
n
ˆi GEBV Xi g
i 1
SNP 数量 SNP 效应
1 + 1 - 1 - 1 + 1 + 25 - 1 + 1 - 1 - 1 - 1 + 42 + 1 - 1 - 1 - 1 - 1 - 22 - 1 + 1 - 1 - 1 = +38
y Xf Za e
参考群和选择群中所有个体的GEBV 参考群中所有个体的表型值
a = Wg
Wij = Zij – 2pj
2 a
Var (a) G
Gij = proportion of genome that is IBD between animals i and j
GEBV的估计 - 直接法
• 标记辅助选择
Phenotypic data
Marker assisted selection
Genes
Molec. Genetics
Genes or Markers
Molecular data
基因组选择提出的背景
• 常规的标记辅助选择(MAS)
– 利用对性状有较大影响的基因(标记)信息进 行辅助选择 – 需要先进行主效基因或QTL的检测 – 需要与表型信息相结合 – 在动物育种中的应用非常有限,因为 • 可用的基因(标记)数量很有限 • 这些基因只能解释很小比例的遗传变异
参 考 群 体
性状表型 标记基因型
>50,000 SNPs
估计所有标 记的效应
选 择 群 体
标记基因型
>50,000 SNPs
gEBVs
标记基因型
>50,000 SNPs
gEBVs
SNP效应 的估计
• Difficulties
– Number of effects >>> number of records • Effects:> 40 000 • Number of records?
0 0 A 0 G A 22
genomic relationship matrix
Pedigree-based relationship matrix 1 ungenotyped, 2 genotyped
GEBV的估计 - 间接法
• 先由参考群体估计SNP效应 • 计算选择群中候选个体的GEBV
– Combing information from all genotyped and ungenotyped animals
ˆ Xy XX XZ b 1 ˆ ZX ZZ kH a Zy
H A A
A11 A A 21 A12 A 22
2
+
Pedigree
EBV selection Marker assisted selection Genomic selection
G enes
+ Markers +
Whole genome markers
基因组选择提出的背景
• 传统的选择方法
Black box of
h2 Selection Estimated Breeding Value (EBV)
SNP效应
基因组选择的基本过程
1. 建立参考群体
获得每个个体的性状表型 测定每个个体的SNP基因型(用SNP芯片) 估计SNP效应
2. 在选择群体中进行基因组选择
测定候选个体的SNP基因型 计算个体GEBV 依据GEBV进行选择
GEBV的估计
Direct
Marker-derived relationship matrix
基因组选择的基本思想
• 在动物的基因组中存在大 量遗传标记 • 最常见的是SNP标记(至少 300万个) • 影响性状的所有基因都至 少与一个标记紧密连锁
SNP
genome
Gene
基因组选择的基本思想
• 通过对所有标记效应的估计实现对全基因 组所有基因效应的估计 • 利用估计的标记效应计算个体育种值 - 基因组育种值(GEBV) • 根据gEBV的大小进行选择
0 = homozygous for first allele (alphabetically), 1 = heterozygous 2 = homozygous for second allele (alphabetically)
基因组育种值
- 所有标记效应的总和
+ 40
Chr 1
Chr 2
Chr 3
美国奶牛产奶量的选择进展
13000 12000 11000 10000 9000 8000 7000 6000 5000
1960 1963 1966 1969 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 Milk Yield kg
动物基因组选择 -理论与应用
张 勤 中国农业大学动物科技学院
什么是基因组选择
• Genomic selection (GS) (Meuwissen et al. ,2001) • 利用覆盖全基因组的高密度分子遗传标记进行的 标记辅助选择
Phenotypic selection
Phenotypes
h
基因组选择的优势
无需进行主效基因或QTL的检测 可以不依赖表型信息 早期选择 缩短世代间隔,降低育种成本 能够捕获基因组中的全部遗传变异 提高选择准确性 提高选择强度 大幅度提高育种进展(up to 50%) 尤其对于传统选择方法受限的性状,更具优势
选择强度 选择准确性 遗传标准差 遗传进展 世代间隔
ˆ Xy XX XZ b MME: 1 1 A G Z y ˆ a ZX ZZ k TA
常规BLUP: A 矩阵 系谱 GBLUP: G 矩阵 全基因组标记基因型 TABLUP: TA 矩阵 标记基因型 + 标记效应
实现基因组选择的前提条件
• 对SNP标记的高通量测定技术 - SNP芯片技术
SNPs 在染色体上的分布
奶牛50K芯片
SNP基因型数据
1000111220020012111011112111101111001121100020122002220111 1202101200211122110021112001111001011011010220011002201101 1200201101020222121122102010011100011220221222112021120120 2010020220200002110001120201122111211102201111000021220200 0221012020002211220111012100111211102112110020102100022000 2201000201100002202211022112101121110122220012112122200200 0200202020122211002222222002212111121002111120011011101120 0202220001112011010211121211102022100211201211001111102111 2110211122000101101110202200221110102011121111011202102102 1211011022122001211011211012022011002220021002110001110021 1021101110002220020221212110002220102002222121221121112002 0110202001222222112212021211210110012110110200220002001002 0001111011001211021212111201010121202210101011111021102112 2111111212111210110120011111021111011111220121012121101022 202021211222120222002121210121210201100111222121101
ˆ Wy WX f WW MME X W X X Iλ X y ˆ g
2 e
2 g
SNP效应估计方法
• Bayesian method
Model for the data
Model for the marker variance
Genes
Quantitative genetics
Phenotype
B LU P
Environment
Phenotype of relatives
基因组选择提出的背景
• 选择进展
选择强度 选择准确性 遗传标准差 遗传进展 世代间隔
Key factors
基因组选择提出的背景
• 传统选择方法 - 案例1
SNP效应估计方法
• Least squares method
– Test each SNP,take those with significant effect – Fit the significant SNPs simultaneously in multiple regression – Problems • Do not capture all QTL • Over-estimation of SNP effects due to setting of significance threshold
SNP效应估计方法
• RR-BLUP (Rirdge Regression BLUP)
n
y Wf X j g j e
j 1
gj= SNP effect
2 Var (g j ) I g
Assume equal variance of SNP effect across all segments!
The TA matrix
IBS at locus k between individual i and j
S ijk m1 n 1 I mn 4
Weighted average IBS over all loci
N N
2
2
Sijk AA Aa aa
AA 1 0.5 0
Aa 0.5 0.5 0.5
aa 0 0.5 1
S ij k 1 S ijk wk
k 1 wk
Correction for the mean IBS
( S ij 2 S ) (1 S ) Sij
The TA matrix: TAij 2 S ij
GEBV的估计 - 直接法
• Single step (misztal et al., 2009)
Reference
Phenotypes
Indirect
Marker effects
Genotypes
Candidate
Genotypes
GEBV
GEBV
GEBV的估计 - 直接法
• GBLUP (VanRaden and Tooker, 2007)
– BLUP with genomic relationship matrix (G matrix)
Birth Year
基因组选择提出的背景
• 传统选择方法 -案例2
加拿大猪生长速度的选择进展
基因组选择提出的背景
• 传统选择方法的局限性
– – – – – 低遗传力性状 难以度量的性状 限性性状 不能早期度量的性状 需要屠宰才能度量的性状
分子遗传学为突破这些局限性提供了机遇!
基因组选择提出的背景
GBLUP MME:
ˆ Xy XZ f XX ˆ ZX ZZ Gk a Zy
k
2 e
2 a
GEBV的估计 - 直接法
• TABLUP (Zhang et al., 2010)
– BLUP with trait-specific marker derived relationship matrix (TA matrix)