关联分析相关软件演示精品PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

TASSEL
演示
1、powermarker算出后为何不显示聚类图? 需要安装MEGAV4.0分子进化遗传分析软件
2、STRUCTURE为何都是按正常操作进行却不能运行? 重新加载工程即可,勿须重新建立工程 3、TASSLE软件无法启动!? TASSLE need java1.5
4、标记分析时需注意那些问题?
Distruct---柱形图绘制
参见distruct软件包,将文中的相应部分替换为自己 的相应数据即可。
of SPAGeDi
群体 大小
亚群 数目
空间 坐标
标记数目
用于定位基 因型的最大
字符数
二倍体
➢ spagedi参数选择问题:
第一步:1 kinship coefficient 第二步:4 Jackknief over loci 第三步:3 Report matrices with pairwise spatial distances and
of Structure
Marker name
Missing genotype
Marker genotype
应用STRUCTRE软件(Pritchard 2000),是对群体进行 基于数学模型的类群划分,并计算材料相应的Q值(第i材 料其基因组变异源于第k群体的概率)。分析的大致理念是, 首先假定样本存在K个等位变异频率特征类型数(即服从 Hardy-Weinberger平衡的亚群,这里K可以是未知的), 每一类群标记位点由一套等位变异频率表征,将样本中各 材料归到(或然率用Bayesian方法估计)第k个亚群,使得该 亚群群体内位点频率都遵循同一个Hardy-Weinberg平衡。
structure
➢Create a new project 1) Project information 2) Information of input data set 3) Format of input data set
➢Set up parameters ➢Results
演示
Inbred line name
Inbred lines number
Phenotypic data
Traits nummer
Head rows nummer
Inbred line name
Traits
Population structure
Output Structure
Kinship
Output SpageDi
DEMO of related software in association analysis
2010.5.18
➢PΒιβλιοθήκη Baiduwermarker ➢Structure2.2 ➢SPAGeDi ➢TASSEL2.0
More information
➢Powermarker ➢Structure2.2 ➢SPAGeDi ➢TASSEL2.0
6、缺失数据如何表示?
TASSLE:For trait data and population structure, use “999”for missing For SNP data, use “N”. For SSR data, use “?”. Kinship does not allow for missing values. Structure: missing genotype :-9.
a:allelic size,b:need CK
5、多少标记估计群体结构(Q)及kinship(K)合适?
For Q,>1000 single nucleotide polymorphisms or 100 simple sequence repeats for maize. For K (a minimum of several hundred SNPs spread over the whole genome is recommended.
=
SSR带型记录
➢第一种读带方式:
以0、1统计,相同迁移率位置上,有带记为1,无 带记为0。适合于NTSYS,powermarker等软件
➢第二种读带方式:
of Powermarker
引物名称
群体类型
材料名称或编号
标记基因型,中间用“/” 隔开,缺样用?/?表示。
演示
Inbred name two lines
of Tassel
➢Genotypic data ➢Phenotypic data ➢Population structure data ➢Kinship data
Inbred lines number
Genotypic data
Sequence length or marker number
Marker or sequence
K值确定
L′(K) = L(K) – L(K – 1) |L′′(K)| = |L′(K + 1) – L′(K)|
ΔK = m|L′′(K)|/s[L(K)] ΔK =m(|L(K + 1) − 2 L(K) + L(K − 1)|)/s[L(K)]
注: s[L(K)]为标准差,K值确定方法具体请参考原文献:
写在最后
经常不断地学习,你就什么都知道。你知道得越多,你就越有力量 Study Constantly, And You Will Know Everything. The More
genetic coefficients 第四步:3 mutilocus estimates <matrix and columnar forms>
➢ 生成的结果需做如下处理:
将生成的txt文件用excel打开,然后将矩阵数据部分复制到一excel中,对于 小于0的数据用0代替,对角线上的空着的用1代替,最后对整个矩阵乘以2 即可,此时可用于tassel分析。演示
G. EVANNO, S. REGNAUT and J . GOUDET, Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study[J]. Molecular Ecology,2005,14, 2611–2620.
相关文档
最新文档