扩增子-α多样性分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
扩增子-α多样性分析
一、α多样性的概念
一个特定区域生态环境下的物种数目,因此也被称为生境内的多样性,即样品内部的物种多样性,与其他样品无关。
二、α多样性指数
环境微生物研究中,通常用一系列统计学分析指数来表示α多样性,分类如下:
1、丰富度:物种丰富度(Species Richness,S),即观察到的物种数(OTU 数目)。系统中物种的观察值是其真实物种丰富度的有偏估计值,并且观察值会随着取样的增加呈非线性的增长。对物种数进行比较时,需要相同的样本大小(sample size)。不考虑群落中每个物种的丰度情况,Species Richness(S)数值越大,说明样品中物种越丰富。
(1)Chao1:是用chao1算法估计样本OTU的数量的指数,由Chao (1984) 最早提出。Chao1 值越大代表物种总数越多。
(2)ACE:用来估计群落中OTU 数目的指数,由Chao 提出,是生态学中估计物种总数的常用指数之一,与Chao 1 的算法不同。
2、丰富度和均匀度:α多样性里的Shannon指数、Simpson指数、Dominance、PD whole tree 综合考虑群落物种的丰富度和均匀度。相同物种丰富度的情况下,群落中各物种具有越大的均匀度,则认为群落具有越大的多样性。
(1)Shannon-Winner:用来描述种的个体出现的紊乱和不确定性,不确定性越高,多样性也就越高。指数中包含两个因素:
a、种类数目,即丰富度;
b、种类中个体分配上的均匀性(evenness)。种类数目多,可增加多样性;同样,种类之间个体分配的均匀性增加也会使多样性提高。
(2)Simpson:用来估算样品中微生物多样性指数之一,有Edward Hugh Simpson(1949)提出,反映了当随机取样,取到是不同物种的概率大小。Simpon 多样性指数值越大,说明群落多样性越高。
(3)PD_whole_tree:基于系统发育树来计算的一种多样性指数,它用各个样品中OTUs 的代表序列构建出系统发育树的距离,将某一个样品中的所有代表序列的枝长加和,从而得到的数值。数值越大,群落多样性越高。
三、指数组间差异检验
基于每个样品重抽样所得alpha多样性参数,可进行alpha多样性指数组间差异分析,箱形图可以直观的反应组内物种多样性的中位数、离散程度、最大值、最小值、异常值。同时,通过T-test检验、wilcox秩和检验和Tukey检验(只有2个分组时进行T-test和wilcox 秩和检验,分组大于2时进行Tukey检验和wilcox秩和检验)评估不同分组间多样性指数是否有显著性差异。
多样性指数差异分析箱形图
四、稀释性曲线
从样品中随机抽取一定序列数,统计抽到的这些序列所代表物种数目(也即是OTU 数目)或多样性指数,并以序列数(横坐标)与物种数或多样性指数(纵坐标)来构建曲线。
样品曲线的延伸终点对应的的横坐标位置为该样品的测序数量,若多样性指数为observed_species 指数(表征实际观测到的物种数目),当曲线趋向平坦时,说明测序数据量足够,更多的数据量只会产生少量新的物种(也即是OTU),反之则表明继续测序还可
能产生较多新的物种。若是其他多样性指数(如shannon 曲线),曲线趋向平坦时,说明测序数据量足够大,可以反映样品中绝大多数的微生物多样性信息。
稀释曲线
五、Rank-Abundance 曲线
将样品中的OTU 按相对丰度(或者包含的序列数目)由大到小排序得到对应的排序编号,再以OTU 的排序编号为横坐标,OTU 中的相对丰度(也可用该等级OTU 中序列数的相对百分含量)为纵坐标,将这些点用折线连接,即绘制得到Rank Abundance曲线。
曲线可直观反映样品多样性的两个方面,即样品所含物种的丰富程度和均匀程度。物种的丰富程度由曲线在横轴上的长度来反映,曲线越宽,表示物种的组成越丰富;物种组成的均匀程度由曲线的形状来反映,曲线越平坦,表示物种组成的均匀程度越高。
Rank-Abundance曲线