问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

图解 | 怎么解读一个树状图

创作时间:
作者:
@小白创作中心

图解 | 怎么解读一个树状图

引用
1
来源
1.
https://cloud.tencent.com/developer/article/1970275

树状图(Dendrogram)是一种用于展示对象间相似度的可视化工具,广泛应用于层次聚类分析中。本文将通过图文结合的方式,详细介绍树状图的基本概念、解读方法及其在生物信息学等领域的应用。

使用范围

树状图主要用于展示不同对象之间的相似度大小(习惯上称之为距离关系远近)。最常见的是对层次聚类结果的可视化,但其应用远不止于此。只要能够衡量不同对象之间的相似度,都可以通过树状图来进行可视化。

例如,在高通量测序的各个样本中,可以利用层次聚类加树状图来比较各个样本之间的整体表达关系的远近。下图展示了六个观测对象在散点图上的距离关系以及在树状图的具体呈现:

基本概念

在了解树状图之前,需要先理解一些基本的树的概念。树状图的顶端可以看作是树的根,往下分支的部分称为进化枝(clade),末端的部分称为进化叶(leaf)。

图形解读

树状图的解读应从下往上进行。进化枝的排列可以看出哪些叶子彼此之间相近,而每个叶子的高度则代表了不同叶子之间差异/相似程度。高度越高,两个叶子区别越大。

以5个样本的表达谱芯片数据为例,通过层次聚类构建的树状图展示了样本间的相似程度:

从图中可以看出:

  • Sample 2 和Sample 3最为相近
  • Sample 4与Sample 2/3在第二个进化枝上,相似度次之
  • 进而是Sample 1,最后是Sample 5
  • Sample 5与其他四个样本都有一定程度的差异

需要注意的是,树状图的高度是有意义的,而对象的左右位置则主要为了美观,并无实际含义。

其他扩展图形

树状图的概念可以扩展到进化树等其他领域。在热图展示中,行和列通常也会基于聚类分析结果进行树状图排列。此外,传统的树状图也可以通过弯曲处理变成圆形,增加视觉多样性。

对于R语言用户,推荐使用专门绘制树状图的ggtree工具。

参考资料

  1. https://www.displayr.com/what-is-dendrogram/
  2. https://wheatoncollege.edu/wp-content/uploads/2012/08/How-to-Read-a-Dendrogram-Web-Ready.pdf
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号