一、关于扩增子β多样性分析
β多样性(BetaDiversity)是指不同样品间的生物多样性的比较,是对不同样品间的微生物群落构成进行比较。β多样性分析通常由计算环境样本间的距离矩阵开始,对群落数据结构进行自然分解,并通过对样本进行排序(Ordination),从而观测样本之间的差异。β多样性与α多样性一起构成了总体多样性或一定环境群落的生物异质性。
β多样性分析中通常采用以下几种算法:bray_curtis、euclidean、abund_jaccard、unweighted_unifrac、weighted_unifrac等计算任意两个样本间的距离从而获得样本距离矩阵,这些算法主要分为两大类:加权(如Bray-Curtis和WeightedUnifrac)与非加权(如Jaccard和UnweightdeUnifrac)。
利用非加权的计算方法,主要比较的是物种的有无,如果两个群体的β多样性越小,则说明两个群体的物种类型越相似。而加权方法,则需要同时考虑物种有无和物种丰度两个层面。
Braycurtis距离基于物种的丰度信息计算,是生态学上反应群落之间差异性常用的指标之一。WeightedUnifrac距离是一种同时考虑各样品中微生物的进化关系和物种的相对丰度,计算样品的距离,而(UnweightedUnifrac)则只考虑物种的有无,忽略物种间的相对丰度差异。UweightedUnifrac距离对稀有物种比较敏感,而Braycurtis和WeightedUnifrac距离则对丰度较高的物种更加敏感。
最后,基于以上的距离矩阵,通过多变量统计学方法主坐标分析(PcoA,Principalco-ordinatesAnalysis),非加权组平均聚类分析(UPGMA,UnweightedPair-groupMethodwithArithmeticMeans)等分析,进一步从结果中挖掘各样品间微生物群落结构的差异和不同分类对样品间的贡献差异。
1、样本距离heatmap图
β多样性分析首先需要计算任意两个样本间的距离从而获得样本距离矩阵,输入抽平的out_table,选择合适的距离算法(通常为Bray_Cutis),使用usearch软件计算任意两个样本间的距离,得到相异系数距离矩阵,对矩阵进行层级聚类,可以清楚地看出样本分支的距离远近。
图1样本距离heatmap图颜色越蓝表示样本间距离越近,相似度越高,越红则距离越远。热图中对样本间做了聚类,通过聚类树亦可看出样本间的距离关系。
2、PCA分析
PCA(Principal