popgen中文版说明书part1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、POPGENE窗口概览
该软件由C++语言书写。
POPGENE 窗口计算环境有两种类型:Data display windows(数据显示窗
口)和Dialog boxes(对话框).
其窗口菜单包含八部分:
File:用于建立新的数据文件或打开存在的文件
Edit:用于从其他窗口修改和复制文本
Search:寻找或取代选择的文本
Co-Dominant:用于通过用co-dominant 标志去调用物种遗传分析
Dominant:用于通过用dominant 标志去调用物种遗传分析
Quantitative:用于通过用量化特征去调用物种遗传分析
Window:用于布置、选择和控制窗口分布
Help:帮助,告诉你如何使用该软件
在菜单栏下面有工具栏,可以快速容易的使用窗口的特色部分。
底部有状态栏,它提供的信息包括光标位置和输入数据大小。
二、POPGENE 计算程序窗口概览
POPGENE/Co-Dominant 和Dominant markers 两个对话框:Haploid Data Analysis 和Diploid Data Analysis。
每个对话框里有3 个等级的Hierarchical Structure:Single Populations, Groups 和Multiple populations。
Single Locus
和Multilocus 遗传参数的评定通过选择一个或多个Hierarchical Structure 核对框实现的。
HAPLOID DATA ANALYSIS
Gene Frequency: 从原始数据中判断每个locus 的基因频率
Allele Number:计数非零频率等位基因的数量
Effective Allele Number:评价彼此的结合性
Polymorphic Loci: 不管等位基因频率,所有多种组合形态位置的百分比
Gene Diversity:判断Nei’s (1973)基因多样性
Shannon Index: 判断Shannon信息指数,以此作为基因多样性的程度Homogeneity Test: 构建双向相依表和进行(χ2
)和相似率(G2)测试
F-Statistics:为Groups 或Multiple Populations 判断Nei’s (1973) GST,以及GST 和GCS
Gene Flow: 从GST 或FST中的判断中来进一步判断基因流
Genetic Distance: 判断Nei’s (1972)遗传特性和遗传距离以及不偏遗传特性和遗传距离
Dendrogram:用UPGMA做基于Nei’s 遗传距离的树形图
Neutrality Test:用Manly 提出的算法,为临界稳定执行Ewens-Watterson 测试Two-locus LD: 判断loci 和χ2
测试之间的gametic disequilibria
Brown:计算观察的和预想的K的moments
Smouse:编码常出现的等位基因为1,假的等位基因为0. 判断平均内在关系DIPLOID DATA ANALYSIS
Genotypic Frequency: 从针对co-dominant markers 的原始数据中判断每个
locus 的基因频率
HW Test:在随机杂交的情况下,用Levence 计算法则计算预想的遗传型频率,
并且执行基于Hardy-Weinberg 平衡( χ2
)和相似率(G2)的测试,仅限于
co-dominant markers
Fixation Index:判断FIS作为异形接合体缺失或过多的判据
Allele Frequency:判断原始数据的基因频率
Allele Number: 计数非零频率等位基因的数量
Effective Allele Number: 评价彼此的结合性
Polymorphic Loci: 不管等位基因频率,所有多种组合形态位置的百分比
Obs. Homozygosity:判断给定locus 观察到杂合子的比例,仅对于co-dominant markers
Exp. Homozygosity:判断随即杂交的情况下,预想杂合子的比例,仅对于
co-dominant markers
Shannon Index: 判断Shannon信息指数,以此作为基因多样性的程度Homogeneity Test: 构建双向相依表和进行(χ2
)和相似率(G2)测试,测试针对于
Groups 或者Multiple Populations
F-Statistics: 为Groups 或Multiple Populations 判断F-statistics
Gene Flow: 从GST 或FST中的判断中来进一步判断基因流
Genetic Distance: 判断Nei’s (1972)遗传特性和遗传距离以及不偏遗传特性和遗传距离
Dendrogram: 用UPGMA做基于Nei’s 遗传距离的树形图
Neutrality Test:用Manly 提出的算法,为临界稳定执行Ewens-Watterson 测试Two-locus LD: 判断loci 和χ2
测试之间的gametic disequilibria
Smouse: 编码常出现的等位基因为1,假的等位基因为0,他们的异形接合体为
1/2. 判断平均内在关系
三、软件的使用
输入文件格式
输入文件应该由表头和数据两部分构成。
表头的格式应该是这样:(1)用
/* ... */符号限定;(2)populations 的数量;(3)loci 数量;(4)locus 的名字。
数据开始为每个population 的ID #和population 的名字,这两个都是可
选项。
如果这两项没有给出的话,就应该在populations 之间留下至少一个空白行,该软件会自动给你产生population 的ID。
如果这两项给出来的话,你的population的ID#和population 的名字之间必须是不重复的。
原始数据的格式很
自由,纵行之间可以带或不带1 个或更多的空格,但他们之间不能有空行。
对于haploids 和dominant markers 像RAPDs 无值的位置要以“.“代替(也就是说把出现或未出现等位基因的代表为一个点),对diploids co-dominant markers
的用“. .“。
下面给出三个例子。
头两个例子纵行之间有空格,第三个数据中是空格和无空格的混合以说明数据输入的灵活性。
例1:haploid data 的输入格式
/* Haploid numeric data of 3 populations each with 3 records (gametes) & 19 loci */
Number of populations = 3
Number of loci = 19
locus name :
AAT-1 AAT-2 ACO ADH APH DIA-2 DIA-3 GDH G6H IDH MDH-1 MDH-2 MDH-3 MDH-4 ME PGI
PGM 6PG-1 6PG-2
ID = 1
1 1 1
2 1 1 1 1 2 1 1 1 2 1 1 1 1 1 1
1 1 1
2 1 1 1 1 2 1 1 1 2 1 1 1 1 1 1
3 1 1 3 1 1 1 1 2 1 1 1 2 1 1 1 2 1 1
ID = 2
1 1 1
2 1 1 1 1 2 1 1 1
3 1 1 1 1 1 1
1 1 1 1 1 1 1 1
2 1 1 1 6
3 1 1 1 1 1
1 1 1 1 1 1 1 1
2 1 1
3 3 1 1 1 1 1 1
ID = 3
1 1 3
2
3 1 1 1 1 1 1 1 2 1 1 1 1 1 1
1 1 1
2
3 1 1 1 2 1 1 1 2 1 1 1 1 1 1
1 1 3
2 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1
例2:diploid data, co-dominant marker 的输入格式
/* Diploid alphabetic data of 3 populations each with varying records (genotypes) & 21 loci */
Number of populations = 3 PopGene
Number of loci = 21
Locus name :
AAT-1 AAT-2 AAT-3 ACO ADH DIA-1 DIA-3 EST-2 GDH G6P HA
IDH MDH-1 MDH-2 MDH-3 MDH-4 PEP-1 PEP-2 PGI-2 PGM SPG-2
AA AA AA AA AA AA AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AB BB A3 AA AB BB AA AA AA AA AA AA AA AA AA AB AA AA
AA AA AA AA BC AC AA AB AB AB AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA BB CC AA BB AB AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA AB AC AA BB AA AA AA AA AA AA AA AC AA AA AA AB AA
AA AA AA AB AB AC AA AB AB AA AA AA AA AA AA AB AA AA AA AA AA
AB AA AA AA BC AC AA AB AB AA AA AA AA AB AA AB AA AA AA AA AA
AA AA AA AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA AC AA AA
AA AA AA AA AA BC AA AB AA AA AA AA AA AA AA AB AA AA AA AA AA
AA AA AA AB BC BC AA BB AB AA AA AA AA AB AA AA AA AA AA AC AA
AA AA AA AB AC AB AA BB BB AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA AB AC AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA
AA AA AA AA AA BC AB AB AA AA AA AA AA AA AA AA AA AA AC AA AA
AA AA AA AB AA AC AA AB AB AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA AA BB BB AA AA AA AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA AA AC AC AA BB AB AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AB BB BC AA BB AA AC AA AA AA AA AA AA AA AA AC AD AA AA AA AA AA AB BC AA AB AB AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA BB BC AA BB AA AA AA AA AA AA AA AB AA AA AA AC AA AA AA AA AA AA BC AA AB AB AA AA AA AA AA AA BC AA AA AA AA AA AA AA AA AA AB BC AA AB AB AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA AA BD BC AA AB AB AA AA AA AA AA AA AA AA AA AC AE AA AA AA AA AB CC BB AA BB AA AA AA AA AA AA AA AA AA AA AA AB AA AA AA AA AA BC BB AA AB AB AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AB CC BB AA AA AB AA AA AA AA AA AA AA AA AA AA AB AA AA AA AA AA BB BC AA AB AB AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AB BC AA AA BB AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA AB AC AB AA BB AA AA AA AA AA AA AA AA AA AA AA AB AA AA AA AA AB BC BB AA BB BB AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA AB AB AB AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA BB AB AA AA AA AA AA AA AA AA AA BB AA AA AA AA AA AA AA AA AA AC BC AA BB AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA CC BC AA AB AB AA AA AA AA AA AA AB AA AA AA AC AA AA AA AA AA BB AC AA BB AA AA AA AA AA AA AA AA AA AA CC AA AA AA AA AB AA BE BB AA BB AB AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA AA AB BC AA AB AA AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA BB AA CC AA AB AB AA AA AA AA AA AA BC AA AA AA AA AA AA AA AA AB AC BC AA BB BB AA AA AA AA AA AA AA AA AA AA AA AA AA AA AA AB AA BB AA AC AB AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA AB BB AC AA BB AA AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA AA AC AC AA AA AB AA AA AA AB AA AA AB AA AA AA AA AA AA AA AA AA AA AB AA AB AB AA AA AA AA AA AA AB AA AA AA AA AA AA AA AA AA BC BC AA BB AB AA AA AA AA AA AA AB AA AA AA AC AA
例3:diploid data, dominant marker 的输入格式
Number of populations = 2
Number of loci = 28
Locus name :
OPA01-1 OPA01-2 OPA01-3 OPA01-4 OPA01-5
OPA03-1 OPA03-2 OPA03-3 OPA03-4 OPA03-5 OPA03-6
OPA04-1 OPA04-2 OPA04-3 OPA04-4 OPA04-5 OPA04-6 OPA04-7 OPA07-1 OPA07-2 OPA07-3 OPA07-4 OPA07-5 OPA07-6
OPA11-1 OPA11-2 OPA11-3 OPA11-4
fis = -0.238
11101 100100 0111010 001000 1001
10110 100100 0011010 001000 0001
11100 100100 0011010 001000 0001
11111 100100 0011010 001010 0001 10110 101100 0011010 001010 1101 11000 100100 1001010 001000 0001 11101 100100 0101010 001000 1001 10110 100100 0000110 111101 0001 11001 100100 0111010 001010 1001 11101 101100 0101010 001000 1001 11100 100100 0011010 110000 1001 11101 111100 0011010 001000 0001 11111 111000 0101010 001000 0001 11000 100100 0000010 001010 0001 11001 100100 0110010 001000 1001 11101 101000 1000010 001000 1001 name = Little Smoky
fis = 0.0
11101 111101 0111010 111000 1111 11101 111100 0011010 001000 1111 11110 100001 1011010 101010 1011 11101 111000 0011010 001011 0001 10101 111111 0011010 111000 0101 11000 100000 0111010 111010 0111 10001 101000 0011010 011000 1001 11101 101111 0011010 011010 1001 11001 101010 0011010 101010 1011 11011 111100 0011010 011010 1011 11110 111101 0011010 001001 0011 11001 111111 1011010 001010 1001 11111 111110 0000010 111010 0111 11011 101000 0011010 001000 0001 11101 100000 1111010 001000 1001 11111 100000 1111010 001000 1001 11100 101100 0001010 000101 0110 11001 101100 0100010 110100 1001 10101 100100 0011010 000010 1001 11001 111000 0010010 001000 0001。