R语言:KEGG富集、可视化教程,附代码
创作时间:
作者:
@小白创作中心
R语言:KEGG富集、可视化教程,附代码
引用
1
来源
1.
https://www.cnblogs.com/wuzhixiake/p/18248138
KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析是生物信息学中常用的一种功能富集分析方法,主要用于分析基因组学数据在代谢通路中的富集情况。本文将详细介绍如何使用R语言进行KEGG富集分析,并对结果进行可视化展示。
1. 安装所需包
首先需要安装一些必要的R包:
install.packages("colorspace")
install.packages("stringi")
source("https://bioconductor.org/biocLite.R")
biocLite("DOSE")
biocLite("clusterProfiler")
biocLite("pathview")
2. 加载所需包
安装完成后,加载这些包:
library("colorspace")
library("stringi")
library("DOSE")
library("clusterProfiler")
library("org.Hs.eg.db")
library("enrichplot")
library("ggplot2")
3. 设置工作路径并加载“clusterProfiler”包
setwd("C:\\Users\\31791\\Desktop\\KEGG")
library("clusterProfiler")
4. 导入id.txt文件
假设你已经有一个包含基因ID的id.txt文件,运行以下代码:
rt=read.table("id.txt",sep="\t",header=T,check.names=F)
rt=rt[is.na(rt[,"entrezID"])==F,]
geneFC=rt$logFC
gene=rt$entrezID
names(geneFC)=gene
5. 进行KEGG富集分析
kk <- enrichKEGG(gene = gene, organism = "hsa", pvalueCutoff =0.05, qvalueCutoff =0.05)
write.table(kk, file="KEGG.txt",sep="\t",quote=F,row.names = F)
6. 可视化绘制气泡图和柱状图
# 柱状图
tiff(file="barplot.tiff",width = 20, height = 20, units ="cm",compression="lzw",bg="white",res=600)
barplot(kk, drop = TRUE, showCategory = 20)
dev.off()
# 点图
tiff(file="dotplot.tiff",width = 20, height = 20, units ="cm",compression="lzw",bg="white",res=600)
dotplot(kk, showCategory = 20)
dev.off()
7. 通路图
利用pathview查阅代谢通路图并导出:
library("pathview")
keggxls=read.table("KEGG.txt",sep="\t",header=T)
for(i in keggxls$ID){
pv.out <- pathview(gene.data = geneFC, pathway.id = i, species = "hsa", out.suffix = "pathview")
}
8. 结果展示
以下是部分可视化结果:
热门推荐
34个省级行政区的“招牌菜”都是什么?如果都能吃全的,绝对厉害
怎么判断自己眼压高
地砖用哪种拖把好?为你解答家居清洁选择困惑
台式电脑电源不稳定的表现与解决方案
「新药进展速递」 辉瑞启动全球首个CD25 ADC临床试验
行列式和矩阵的区别 有什么不同之处
人体工程学与工作安全
2025造车新势力分化:理想、极氪同环比双降,小鹏、蔚来逆势突围
婴儿肺炎为何拒奶?这些护理要点请收好
飞向世界的中国蝴蝶——观舞台"梁祝"之"蝶变"
珠海长隆旅游攻略,珠海长隆海洋王国一日游攻略
体重指数BMI计算对照表:从过低到极度肥胖的健康指南
如何有效评估患者的生命体征?
从CAD软件上传到云盘:简便上传图纸
医院诊疗出问题怎么办?从宠物医疗到人医收费维权指南
猫咪主人起诉宠物医院:状告医疗失误导致猫咪死亡
回避型伴侣不回消息的原因分析,内心的挣扎与自我保护
英国装甲技术:1939年“十字军战士”重甲防护型坦克
重写“中国文学史”的新尝试——张隆溪的“中国自主意识”
PLC、DCS、SCADA三者有什么区别?
国家土地分类标准及其用途和利益性质
视网膜脱落的主要原因是什么
心脏早搏的五大诱因及科学防治指南
项目经理如何处理甲方
写作怎么增强说服力(写作中增强说服力的方法)
一次性就业补助金谁来支付?如何计算?
法院判决后借款人没钱利息怎么计算
车把手插入男孩腹部!利器贯穿伤急救“5要点”要记牢
仿宋字体的魅力:历史沿革与现代设计应用
如何在复杂的股市环境中做出合理判断?这些判断依据有哪些要点?