问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

微生物测序报告中的多样性数据详细解读

创作时间:
作者:
@小白创作中心

微生物测序报告中的多样性数据详细解读

引用
CSDN
1.
https://m.blog.csdn.net/Hangzhou_Guhe/article/details/142880073

随着高通量测序技术的发展,科学家们能够解析巨量微生物DNA序列,从而获得丰富的微生物组数据。这些数据经过聚类、数据分析等处理后,可以得到微生物多样性分析报告。本文将详细解读微生物群落多样性的概念、分类以及各种多样性指标的计算方法和应用场景。

微生物群落多样性的概念

微生物群落多样性(Microbial Community Diversity)是指在特定环境中存在的微生物种类的数量和分布情况。它不仅包含不同种类微生物的丰度,还包括它们之间的相互关系。多样性可以从不同角度进行评价,主要分为以下几种:

  • α多样性(Alpha Diversity): 这是衡量某一特定样本内部多样性的指标。常用的α多样性指标包括物种丰富度(Species Richness)、香农指数(Shannon Index)和辛普森指数(Simpson Index)。

  • β多样性(Beta Diversity): 不同样本之间的多样性比较被称为β多样性。常用的β多样性指标包括Bray-Curtis距离和Jaccard指数。

  • γ多样性(Gamma Diversity): 这是指在一个更大尺度、多个样本的总体多样性,通常用以评估一个较大区域的整体多样性水平。

实验流程与数据处理

下图是实验上机测序流程,提取的样本总DNA经过质检、PCR扩增、建库等步骤进行高通量测序得到测序原始数据。原始数据经过Reads拼接、tags过滤、去嵌合体等步骤得到有效数据clean data。在特定的相似度下进行聚类得到OTU/ASV,报告中通过降噪方法得到ASV表,一切后续分析都围绕ASV表来进行。根据ASV表可以继续做物种分类注释、丰度计算、多样性分析、差异分析、功能预测等。所以ASV特征表是微生物多样性分析中关键数据结果。

OTU和ASV的区别

  • OTU(Operational Taxonomic Units): OTU是一种将序列通过相似度聚类的传统方式,来表示相似序列组成的种群。通常,这种聚类方法会将序列之间相似度达到97%(或其他设定的阈值)的序列分到同一个OTU。

  • ASV(Amplicon Sequence Variants): ASV采用较新的降噪方法,可以精确地解析序列中的每一个核苷酸差异,简单来说就是以100%相似度进行聚类,对低质量序列进行去除和校正,这种方法可以生成“零半径OTU”,即互不相同的基于序列的变体。

测序原始数据情况

原始序列数据(raw tags)经过质控、过滤、去嵌合体,最终得到有效数据(effective tags)。再对有效数据进行UNOISE降噪处理,得到ASV特征表。数据处理过程中各步骤得到的序列进行途径统计,可以直观的反映每个样本的数据量和物种丰度。

Alpha多样性分析

Alpha多样性主要用来衡量单个样本内的菌群多样性,不涉及样本之间的比较。Alpha多样性与两个因素相关,分别是:一、丰富度(richness),二、多样性(diversity)。

计算群落丰富度的指数

  • Chao1:Chao1算法用于评估样本中所含ASV数目的指数,Chao1在生态学中常用来估计物种总数,由Chao(1984)最早提出。

  • ACE:用来估计群落中含有ASV数目的指数,由Chao提出,是生态学中估计物种总数的常用指数之一。

计算群落多样性的指数

  • Shannon:香农-威纳指数综合考虑了群落的丰富度和均匀度,是用来评估样本中微生物多样性指数之一。

  • Simpson:辛普森多样性指数对菌群多样性评估,Simpson指数值越高,表明群落多样性越高。

测序深度指数

  • Coverage:是指各样品克隆文库的覆盖率,其数值越高,则样品中序列被测出的概率越高,而没有被测出的概率越低。

Beta多样性分析

Beta多样性指的是样本间多样性,Beta多样性是衡量个体间菌落构成相似度的一个指标。通过计算样本间距离可以获得beta多样性距离矩阵,Beta多样性计算主要基于OTU的群落比较方法,有欧式距离、bray curtis距离等。

物种多样性相关曲线

  • 稀释性曲线(Rarefaction curve):稀释曲线是从每个样本中随机抽取一定数量的序列,统计这些序列所代表的ASV数目,以随机抽取的序列数与ASV数量来构建曲线。

  • 丰度等级曲线(Rank abundance curve):Rank-abundance曲线可用来解释多样性的两个方面,即物种丰度和物种均匀度。

Beta多样性分析方法

  • 欧式距离(Euclidean distance):欧几里得距离是空间中两点间“普通”(即直线)距离。

  • Bray-Curtis距离:Bray-Curtis距离是生态学中用来衡量不同样地物种组成差异的测度。

  • Unweighted UniFrac距离:非加权距离包含特征之间的系统发育关系的群落差异定性度量。

  • Weighted UniFrac距离:加权距离包含特征之间的系统发育关系的群落差异定量度量。

统计检验方法

  • Anosim检验:Anosim分析是一种非参数检验,用来检验组间差异是否显著大于组内差异。

  • Adonis检验:Adonis检验,多元方差分析,其实就是PERMANOVA,亦可称为非参数多元方差分析。

数据可视化方法

  • PCA分析:PCA(Principal Components Analysis)即主成分分析,首先利用线性变换,将数据变换到一个新的坐标系统中。

  • PCoA分析:主坐标分析 PCoA (Principal component analysis)是一种非约束性的数据降维分析方法,可用来研究样本群落组成的相似性或相异性。

  • NMDS分析:非度量多维尺度分析 NMDS 分析(Nonmetric Multidimensional Scaling)与上述 PcoA 分析类似,也是一种基于样本距离矩阵的分析方法,通过降维处理展现样本特定的距离分布。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号