网络药理学:零基础复现生信文章之GO和KEGG富集分析
网络药理学:零基础复现生信文章之GO和KEGG富集分析
本文将介绍如何使用DAVID和metascape数据库进行GO和KEGG富集分析。对于零基础的读者,建议先观看文中推荐的视频教程,了解GO和KEGG富集分析的基本概念和具体操作步骤。
前言
在生物信息学研究中,GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析是常用的数据分析方法。本文将介绍如何使用DAVID和metascape数据库进行GO和KEGG富集分析。
数据库网址
- DAVID数据库:https://david.ncifcrf.gov/
- metascape数据库:https://metascape.org/gp/index.html
本文复现论文步骤
- 对交集靶点做GO和KEGG的标注和富集分析,对应步骤【一】和【二】
一、DAVID数据库下载GO和KEGG所需数据集
详细步骤请参考以下文章:
https://zhuanlan.zhihu.com/p/657096321
该文章介绍了如何下载KEGG数据集,下载GO数据集的方法类似。下载下来分别是GO的三个数据集文件。
二、GO和KEGG富集分析
推荐视频(必看!)
在进行该文章复现之前,希望大家能对GO和KEGG富集分析有一个大概的了解,推荐把以下前置知识看完,总共也才用时十几分钟。
什么是富集分析?
B站视频:https://www.bilibili.com/video/BV16GpmeSEkD/
该视频主要讲解了什么是富集分析,为什么需要富集分析,以及什么是GO和KEGG富集分析。
up主补充在评论区的知识点:P值大小可以简单的理解为可信度的高低,p值越小可信度越高。在本次的例子中,P值越小,我们就越有把握说某个基因是差异基因;p值越大,结果不具有可信度,就没把握说某个基因是差异基因。
因此在统计学上通常以p=0.05为标准,小于0.05结果可信度高,大于0.05的数据一般用不了。
如何解读GO富集分析结果图?
B站视频:https://www.bilibili.com/video/BV1zF41197XB/
该视频讲解了常见GO富集分析的结果图有哪些,怎么看结果图(譬如横纵坐标有什么意义),还讲了如何快速从Log P转为P值,以及如何利用微生信在线做图。
但是up主讲错了一点,就是metascape可以勾选多条条件,譬如把Go的CC、BP、MF都勾选上,然后去富集分析。
做出来的图长这样:
GO数据集的各个数值代表的意义
B站视频:https://www.bilibili.com/video/BV1HU4y1m7Vu/
该视频详细讲解了GO数据集的各个数值代表的意义。
如何从metascape下载KEGG的数据集
B站视频:https://www.bilibili.com/video/BV1Fg411n7hx/
该视频讲解了如何从metascape下载KEGG的数据集。
其他补充:Fold Enrichment≈富集因子≈Rich Factor。而FDR是另一种指标,一般KEGG气泡图的横坐标是前者。
如何挑选核心通路和靶点
B站视频:https://www.bilibili.com/video/BV1zG411A7kG/
该视频教你KEGG富集分析后如何挑选核心通路,进而挑选核心靶点。
R代码
待更