问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

单细胞测序数据降维与细胞亚型鉴定方法总结

创作时间:
作者:
@小白创作中心

单细胞测序数据降维与细胞亚型鉴定方法总结

引用
CSDN
1.
https://m.blog.csdn.net/weixin_53637133/article/details/138267985

随着单细胞测序技术的快速发展,每个研究或实验中测定的细胞数量显著增加。从几百到几十万,甚至更多的细胞数量,给数据处理带来了巨大挑战。细胞亚型的鉴定是单细胞测序技术的一个重要应用,但高维数据的复杂性要求我们在分析前进行降维处理。本文总结了单细胞测序数据的降维方法和细胞亚型的鉴定聚类方法,帮助读者更好地理解和应用这些技术。

单细胞测序数据的降维方法

单细胞测序数据的降维方法主要可分为两大类:

1. Dimensionality reduction(降维)

降维方法通常是把高维数据通过优化保留原始数据中的关键特征后投射到低维空间,从而可以通过二维或三维的形式把数据展示出来。

常用的降维方法有:

  • PCA(Principle Component Analysis):主成分分析,是一种线性的降维方法;
  • t-SNE(T-distributed stochastic neighbor embedding):是一种非线性的降维方法;
  • UMAP (uniform manifold approximation and projection):Becht et al., 2018, Nat. Biotechnol.
  • scvis:Ding et al., 2018, Nat. Commun.

其中PCA和t-SNE被广泛应用于已发表的单细胞测序相关文章中。特别注意,PCA和t-SNE是降维的方法,并不是聚类方法。

2. Feature selection(特征选择)

特征选择主要是通过去除信息含量少的基因而保留信息含量最多的基因来降低数据的维度。

常用的Feature selection的方法有:

  • 基于先验信息的方法(如已知细胞的亚型)。比如通过SCDE软件鉴定已知不同细胞亚型间的差异表达基因,然后再基于差异表达基因来聚类分析等。
  • 非监督方法。又可细分为:
  • 基于highly variable genes (HVG);
  • 基于spike-in,如scLVM (Buettner et al., 2015)和BASiCS (Vallejos et al., 2015)等;
  • 基于 dropout,如M3Drop (Andrews and Hemberg, 2018)。

单细胞测序数据细胞亚型鉴定方法

1. 监督的方法

比如基于特定细胞亚型的已知marker基因来聚类分析。

2. 非监督的方法(unsupervised clustering)

又可细分为:

  • k-means:通常可结合PCA和t-SNE等来使用;
  • hierarchical clustering:运行速度比K-means要慢;
  • density-based clustering:需要基于大样本才能提高聚类的精度;
  • graph-based clustering:是density-based clustering的一个延伸,可以应用于上百万的细胞数量。

不同细胞亚型鉴定聚类方法运行时间和具体性能的比较

因此,从上面的图中可知,不同的聚类方法所具备的特点可能不一样,有些聚类方法运行时间短,有些聚类方法的结果更准确。可根据具体的数据情况,选择相应的软件。建议选择最新发表、且发表在高质量期刊的软件。

基础知识,了解即可

本文原文来自CSDN

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号