关联分析相关软件演示
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
http://www.powermarker.net
Structure2.2
http://pritch.bsd.uchicago.edu/software/structure22/
SPAGeDi
http://www.ulb.be/sciences/ecoevol/spagedi.html
TASSEL2.0
3) Format of input data set
Set up parameters
Results
演示
K值确定
L′(K) = L(K) – L(K – 1)
|L′′(K)| = |L′(K + 1) – L′(K)|
ΔK = m|L′′(K)|/s[L(K)]
Phenotypic data
Head rows nummer
Traits nummer
Inbred line name
Traits
Population structure
Output file from Structure
Kinship
Output file from SpageDi
TASSEL
第二种读带方式:
File format of Powermarker
引物名称 群体类型
材料名称或编号
标记基因型,中间用“/” 隔开,缺样用?/?表示。
演示
File format of Structure
Marker name Inbred name two lines Missing genotype
http://www.maizegenetics.net/index.php?option=com_cont ent&task=view&id=89&Itemid=
SSR带型记录
第一种读带方式:
以0、1统计,相同迁移率位置上,有带记为1,无 带记为0。适合于NTSYS,powermarkeቤተ መጻሕፍቲ ባይዱ等软件
DEMO of related software in association analysis
张学海 xuehai85@126.com 2010.5.18
Powermarker
Structure2.2
SPAGeDi TASSEL2.0
More information
Powermarker
ΔK =m(|L(K + 1) − 2 L(K) + L(K − 1)|)/s[L(K)]
注: s[L(K)]为标准差,K值确定方法具体请参考原文献:
G. EVANNO, S. REGNAUT and J . GOUDET, Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study[J]. Molecular Ecology,2005,14, 2611–2620.
生成的结果需做如下处理:
将生成的txt文件用excel打开,然后将矩阵数据部分复制到一excel中,对于 小于0的数据用0代替,对角线上的空着的用1代替,最后对整个矩阵乘以2 即可,此时可用于tassel分析。演示
File format of Tassel
Genotypic data
Phenotypic data
Population structure data
Kinship data
Inbred lines number
Genotypic data
Marker or sequence
Sequence length or marker number
Inbred line name
Inbred lines number
料其基因组变异源于第k群体的概率)。分析的大致理念是,
材料归到(或然率用Bayesian方法估计)第k个亚群,使得该
亚群群体内位点频率都遵循同一个Hardy-Weinberg平衡。
structure
Create a new project
1) Project information
2) Information of input data set
Marker genotype
应用 STRUCTRE 软件( Pritchard 2000),是对群体进行 基于数学模型的类群划分,并计算材料相应的 Q值(第i材 首先假定样本存在 K 个等位变异频率特征类型数(即服从 Hardy-Weinberger平衡的亚群,这里K可以是未知的), 每一类群标记位点由一套等位变异频率表征,将样本中各
Ntsys格式
演示
Distruct---柱形图绘制
参见distruct软件包,将文中的相应部分替换为自己
的相应数据即可。
File format of SPAGeDi
群体 大小 亚群 数目 空间 坐标 标记数目 用于定位基 因型的最大 字符数 二倍体
spagedi参数选择问题:
第一步:1 kinship coefficient 第二步:4 Jackknief over loci 第三步:3 Report matrices with pairwise spatial distances and genetic coefficients 第四步:3 mutilocus estimates <matrix and columnar forms>
演示
1、powermarker算出后为何不显示聚类图? 需要安装MEGAV4.0分子进化遗传分析软件 2、STRUCTURE为何都是按正常操作进行却不能运行? 重新加载工程即可,勿须重新建立工程 3、TASSLE软件无法启动!? TASSLE need java1.5
4、标记分析时需注意那些问题? a:allelic size,b:need CK 5、多少标记估计群体结构(Q)及kinship(K)合适? For Q,>1000 single nucleotide polymorphisms or 100 simple sequence repeats for maize. For K (a minimum of several hundred SNPs spread over the whole genome is recommended. 6、缺失数据如何表示? TASSLE:For trait data and population structure, use “999”for missing For SNP data, use “N”. For SSR data, use “?”. Kinship does not allow for missing values. Structure: missing genotype :-9.
Structure2.2
http://pritch.bsd.uchicago.edu/software/structure22/
SPAGeDi
http://www.ulb.be/sciences/ecoevol/spagedi.html
TASSEL2.0
3) Format of input data set
Set up parameters
Results
演示
K值确定
L′(K) = L(K) – L(K – 1)
|L′′(K)| = |L′(K + 1) – L′(K)|
ΔK = m|L′′(K)|/s[L(K)]
Phenotypic data
Head rows nummer
Traits nummer
Inbred line name
Traits
Population structure
Output file from Structure
Kinship
Output file from SpageDi
TASSEL
第二种读带方式:
File format of Powermarker
引物名称 群体类型
材料名称或编号
标记基因型,中间用“/” 隔开,缺样用?/?表示。
演示
File format of Structure
Marker name Inbred name two lines Missing genotype
http://www.maizegenetics.net/index.php?option=com_cont ent&task=view&id=89&Itemid=
SSR带型记录
第一种读带方式:
以0、1统计,相同迁移率位置上,有带记为1,无 带记为0。适合于NTSYS,powermarkeቤተ መጻሕፍቲ ባይዱ等软件
DEMO of related software in association analysis
张学海 xuehai85@126.com 2010.5.18
Powermarker
Structure2.2
SPAGeDi TASSEL2.0
More information
Powermarker
ΔK =m(|L(K + 1) − 2 L(K) + L(K − 1)|)/s[L(K)]
注: s[L(K)]为标准差,K值确定方法具体请参考原文献:
G. EVANNO, S. REGNAUT and J . GOUDET, Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study[J]. Molecular Ecology,2005,14, 2611–2620.
生成的结果需做如下处理:
将生成的txt文件用excel打开,然后将矩阵数据部分复制到一excel中,对于 小于0的数据用0代替,对角线上的空着的用1代替,最后对整个矩阵乘以2 即可,此时可用于tassel分析。演示
File format of Tassel
Genotypic data
Phenotypic data
Population structure data
Kinship data
Inbred lines number
Genotypic data
Marker or sequence
Sequence length or marker number
Inbred line name
Inbred lines number
料其基因组变异源于第k群体的概率)。分析的大致理念是,
材料归到(或然率用Bayesian方法估计)第k个亚群,使得该
亚群群体内位点频率都遵循同一个Hardy-Weinberg平衡。
structure
Create a new project
1) Project information
2) Information of input data set
Marker genotype
应用 STRUCTRE 软件( Pritchard 2000),是对群体进行 基于数学模型的类群划分,并计算材料相应的 Q值(第i材 首先假定样本存在 K 个等位变异频率特征类型数(即服从 Hardy-Weinberger平衡的亚群,这里K可以是未知的), 每一类群标记位点由一套等位变异频率表征,将样本中各
Ntsys格式
演示
Distruct---柱形图绘制
参见distruct软件包,将文中的相应部分替换为自己
的相应数据即可。
File format of SPAGeDi
群体 大小 亚群 数目 空间 坐标 标记数目 用于定位基 因型的最大 字符数 二倍体
spagedi参数选择问题:
第一步:1 kinship coefficient 第二步:4 Jackknief over loci 第三步:3 Report matrices with pairwise spatial distances and genetic coefficients 第四步:3 mutilocus estimates <matrix and columnar forms>
演示
1、powermarker算出后为何不显示聚类图? 需要安装MEGAV4.0分子进化遗传分析软件 2、STRUCTURE为何都是按正常操作进行却不能运行? 重新加载工程即可,勿须重新建立工程 3、TASSLE软件无法启动!? TASSLE need java1.5
4、标记分析时需注意那些问题? a:allelic size,b:need CK 5、多少标记估计群体结构(Q)及kinship(K)合适? For Q,>1000 single nucleotide polymorphisms or 100 simple sequence repeats for maize. For K (a minimum of several hundred SNPs spread over the whole genome is recommended. 6、缺失数据如何表示? TASSLE:For trait data and population structure, use “999”for missing For SNP data, use “N”. For SSR data, use “?”. Kinship does not allow for missing values. Structure: missing genotype :-9.