基因调控网络分析 gene regulatory network
基因调控网络分析 gene regulatory network
基因调控网络(Gene Regulatory Networks, GRNs)是生物信息学和基因组学领域的重要研究内容,它描述了染色质、转录因子和基因之间的相互作用关系。通过分析GRNs,研究人员可以揭示基因与调控因子之间的复杂关系,了解细胞在疾病中的建立、维持和破坏机制。本文将介绍GRNs的基本概念、研究意义以及推断方法。
什么是基因调控网络
基因调控网络(gene regulatory networks, GRNs)是指染色质(chromatin)、转录因子(transcription factors)和基因(genes)之间的相互作用,产生复杂的调控回路(regulatory circuits)。
最常见的基因调控是,转录因子(transcription factors, TF)与称为顺式调控元件(cis-regulatory elements, CREs)的DNA的特定区域相互作用,例如启动子(promoters)和增强子(enhancers)是常见的顺式调控元件,它们位于同一条DNA分子上,调控基因的转录。
研究基因调控网络的作用
揭示基因与调控因子(regulators)之间的复杂关系,了解细胞如何在疾病中建立(established)、维持(maintained)和破坏(disrupted)。
如何推断基因调控网络
利用基因组(genomic)、转录组(transcriptomic)和染色质可及性(chromatin accessibility)信息可以推断GRNs。主要是从转录组和染色质可及性推断转录因子-基因相互作用的GRNs。目前已有多种方法使用单细胞多模态数据(single-cell multimodal)推断GRNs。
双端单细胞多组学数据推断GRNs的方法
2023, Daniel Kim
- 基于相关性的方法(Correlation-based):寻找转录因子表达、基因表达、顺式调控元件(cis-regulatory elements, CREs)之间相关性
- 基于回归的方法(Regression-based):基于多个预测变量(转录因子的表达、顺式调控元件的可及性(CRE accessibility))对基因表达量进行建模
- 建立概率模型(Probabilistic models):确定最有可能的基因调控因子(regulators)
- 基于动力系统的方法(Dynamical systems-based):基于生物因素(如转录因子表达TF expression,细胞周期阶段cell cycle stage,一般随机性general stochasticity)模拟基因表达的变化
- 基于深度学习(Deep learning-based):使用神经网络来推断转录因子、顺式调控元件、基因和细胞之间的复杂关系。
推断基因调控网络的软件
Bulk转录组/多组学推断基因调控网络
Bulk RNA-seq 推断基因调控网络的软件包括:ARCANE、CLR和MRNet
Bulk多组学更准确的推断基因调控网
:基因调控(gene regulation)和转录(transcription)过程有许多分子机制和参与者,表观遗传修饰因子(epigenetic modifiers)参与复杂的相互作用,来调控基因的表达。这些分子调控因子在启动、促进、增强和调节基因转录方面发挥着重要作用。因此,为了构建更全面的GRNs,重要的是包括额外的调控因子(regulatory factors)和DNA元件,如增强子(enhancers)和沉默子(silencers),以及包括染色质构象(chromatin conformation)的结构信息。例如,ATAC-seq可用于生成更全面的GRN(GRaNIE、PECA、TimeReg)。
- RNA-seq和ChIP-seq鉴定转录因子和靶基因的调控序列(DISTILLER、ChIP-Array2)
- Hi-C捕获的DNA的构象(conformation)与ATAT-seq和RNA-seq整合来增强对基因调控的理解(GRaNIE、PECA、TimeReg)
基于bulk数据的任何分析在推断细胞类型特异性信息上具有挑战性,因为组学的profiles(基因表达量)是在一群细胞中的平均值,从而消除了任何细胞异质性信号。
单细胞转录组/多组学推断基因调控网络
目前已有许多在单细胞数据上推断基因调控网络的方法,包括基于回归(SCENIC、scTenifoldNet),动力系统(SCODE)和信息理论(PIDC)的方法
在单细胞上也可以进行多组学测序(scATAC-seq、scHi-C、scChIP-seq),来实现细胞内分子动力学的全面捕获,分析软件有:DeepTFni、CellOracle、MICA、IReNA。
参考
- Gene regulatory network reconstruction: harnessing the power of single-cell multi-omic data
- Gene regulatory network inference in the era of single-cell multi-omics