问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

网络药理学:零基础复现生信文章之GO和KEGG富集分析

创作时间:
作者:
@小白创作中心

网络药理学:零基础复现生信文章之GO和KEGG富集分析

引用
CSDN
1.
https://blog.csdn.net/zhiaidaidai/article/details/142216466

本文将介绍如何使用DAVID和metascape数据库进行GO和KEGG富集分析。对于零基础的读者,建议先观看文中推荐的视频教程,了解GO和KEGG富集分析的基本概念和具体操作步骤。

前言

在生物信息学研究中,GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析是常用的数据分析方法。本文将介绍如何使用DAVID和metascape数据库进行GO和KEGG富集分析。

数据库网址

本文复现论文步骤

  • 对交集靶点做GO和KEGG的标注和富集分析,对应步骤【一】和【二】

一、DAVID数据库下载GO和KEGG所需数据集

详细步骤请参考以下文章:
https://zhuanlan.zhihu.com/p/657096321

该文章介绍了如何下载KEGG数据集,下载GO数据集的方法类似。下载下来分别是GO的三个数据集文件。

二、GO和KEGG富集分析

推荐视频(必看!)

在进行该文章复现之前,希望大家能对GO和KEGG富集分析有一个大概的了解,推荐把以下前置知识看完,总共也才用时十几分钟。

什么是富集分析?

B站视频:https://www.bilibili.com/video/BV16GpmeSEkD/
该视频主要讲解了什么是富集分析,为什么需要富集分析,以及什么是GO和KEGG富集分析。

up主补充在评论区的知识点:P值大小可以简单的理解为可信度的高低,p值越小可信度越高。在本次的例子中,P值越小,我们就越有把握说某个基因是差异基因;p值越大,结果不具有可信度,就没把握说某个基因是差异基因。

因此在统计学上通常以p=0.05为标准,小于0.05结果可信度高,大于0.05的数据一般用不了。

如何解读GO富集分析结果图?

B站视频:https://www.bilibili.com/video/BV1zF41197XB/
该视频讲解了常见GO富集分析的结果图有哪些,怎么看结果图(譬如横纵坐标有什么意义),还讲了如何快速从Log P转为P值,以及如何利用微生信在线做图。

但是up主讲错了一点,就是metascape可以勾选多条条件,譬如把Go的CC、BP、MF都勾选上,然后去富集分析。

做出来的图长这样:

GO数据集的各个数值代表的意义

B站视频:https://www.bilibili.com/video/BV1HU4y1m7Vu/
该视频详细讲解了GO数据集的各个数值代表的意义。

如何从metascape下载KEGG的数据集

B站视频:https://www.bilibili.com/video/BV1Fg411n7hx/
该视频讲解了如何从metascape下载KEGG的数据集。

其他补充:Fold Enrichment≈富集因子≈Rich Factor。而FDR是另一种指标,一般KEGG气泡图的横坐标是前者。

如何挑选核心通路和靶点

B站视频:https://www.bilibili.com/video/BV1zG411A7kG/
该视频教你KEGG富集分析后如何挑选核心通路,进而挑选核心靶点。

R代码

待更

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号