Cell | 双功能转录因子维持中等水平的基因表达稳定性
Cell | 双功能转录因子维持中等水平的基因表达稳定性
在细胞功能的正常运行中,对基因表达水平的精确控制至关重要。然而,基因表达水平特别是中间水平的定义和严格维持机制仍不明确。清华大学两个课题组合作发现了一类新型转录因子——凝聚体形成型水平调节双作用转录因子,它们通过独特的机制维持基因表达的中间水平稳定性。
背景
真核生物基因表达的调控机制对细胞功能至关重要。基因表达水平的异常波动与多种人类疾病相关,但其精确调控机制尚未完全明了。转录因子(transcription factors,TFs)的可用性、结合可及性、驻留时间与转录强度相关,但传统模型未能充分解释基因调控的稳健性。TF和辅激活因子的内在无序区域(intrinsically disordered regions, IDRs)形成的多价动态相互作用对转录调控具有重要作用,但其在基因组范围内的影响尚未被系统研究。
合成转录激活因子作为研究基因调控的平台,但其激活效果在不同基因位点间存在显著差异,且受染色质背景影响。作者开发了一套工具,通过这些工具的应用,发现了一类特殊的转录因子,它们通过凝聚体形成域的选择性相互作用,能够在一定表达阈值下激活或抑制基因,实现基因表达水平的精确控制。这一发现不仅揭示了一种新的基因表达调控机制,也为生物工程提供了新的工具和方法,有助于深入理解染色质相关凝聚体在转录调控中的作用。
染色质结合凝聚体的检测方法
作者开发了一种名为染色质结合凝聚体的探索性测序(ACC-seq)的新方法,用于在基因组范围内检测与染色质结合的凝聚体。该技术通过改变Tn5转座酶对特定DNA区域的可及性,来生成反映凝聚体存在的DNA可及性模式(图1A和1B)。通过与ATAC-seq的结合,这些模式可以用来识别凝聚体的占据情况。为了验证ACC-seq的有效性,作者利用了SOX2和FUS IDR的融合蛋白,这种蛋白能够形成凝聚体并与特定的DNA基序结合。实验结果显示,在自然状态下,这些凝聚体对Tn5转座酶是可及的,而在化学固定后,凝聚体变得不可及,但在1,6-己二醇预处理后,凝聚体被破坏,DNA恢复了可及性。此外,这种检测到的"深U形"模式是特异性的,仅在凝聚体结合的DNA上观察到,而不出现在裸露DNA或与凝聚体形成无关的结合剂结合的DNA上。ACC-seq的稳健性在多种实验条件下得到了验证,表明这是一种可靠的检测染色质结合凝聚体的方法。
作者通过ACC-seq技术深入研究了1,6-己二醇对非DNA结合蛋白的影响,特别是MED1(IDR)形成的凝聚体。研究发现,尽管MED1(IDR)凝聚体对1,6-己二醇敏感,但它们并不阻碍固定条件下的DNA可及性,也不产生己释放模式。这可能是因为ACC-seq中使用的固定剂需要交联DNA和凝聚体内的直接结合剂才能产生己释放模式。实验还发现,缺乏SOX2结合基序的DNA不表现出己释放模式。
在小鼠胚胎干细胞(mESCs)上应用ACC-seq,作者发现不同条件下的可及性强度轮廓在技术和生物学重复之间具有高度的可重复性。通过k均值算法对基因组区域进行分组,作者发现了表现出"深U形"己释放模式的大型簇,这与FUS(IDR)-SOX2凝聚体中观察到的凝聚体占据情况相似,即1,6-己二醇的添加可以释放固定前的目标DNA(图1C和1D)。因此,这些区域被称为己释放可及区域。此外,还观察到在ACC-seq条件下变化较小的簇,被称为一致可及区域。
在己释放可及区域内高度调控的中等水平转录
作者通过ACC-seq技术对染色质结合凝聚体与转录活动之间的关系进行了深入研究(图 2A)。研究发现,一致可及区域具有较高的DNA可及性,而己释放可及区域的DNA可及性较低(图 2B)。尽管如此,己释放可及区域的基因表达水平介于一致可及区域和不可及区域之间,显示出中等水平的转录活动(图 2C)。通过RNA-seq和GRO-seq数据分析,作者进一步证实了这一点。
在功能层面,一致可及区域主要与管家过程相关,而己释放可及区域则与发育和谱系特异性功能密切相关(图 2D)。作者通过表达水平分组和富集分析,排除了低表达水平本身导致发育功能富集的可能性,表明己释放可及区域的基因在发育过程中具有特异性。
此外,作者利用单细胞RNA-seq数据探究了己释放可及区域基因在干细胞分化过程中的表达动态。结果表明,这些基因在干细胞状态下表达水平较低,但在分化过程中迅速上调(图2E),且这些基因富含转录因子和关键分化调节因子(图2F)。这一发现表明,己释放可及区域的基因可能处于一种准备状态,以便在分化过程中迅速响应(图 2G)。
尽管双价基因模型是调控基因表达的一种重要机制,但作者发现己释放可及区域并未富集双价标记,且这些区域的可及性和表达水平与双价区域存在明显差异(图 2H)。这提示我们,己释放可及区域内的基因表达可能受到其他调控机制的控制,这些机制可能与传统的双价模型并存,共同参与基因表达的精细调控。
富集在六角释放可访问区域的 TFs 的不同相互作用
作者提出了一种新的观点,认为在己释放可及区域内形成的凝聚体模式可能指示特定转录因子的存在,这些转录因子能够调节中等水平的转录。通过分析小鼠胚胎干细胞中的转录因子,作者鉴定了一组在己释放可及区域富含结合位点的转录因子,特别是那些含有能够促进动态分子间相互作用的大的内在无序区域的转录因子(图 3A)。这些转录因子,如ETV5、FUBP1、PITX2和ZIC3,不仅在活细胞中形成核斑点,而且与染色质的动态相互作用有关。
利用活细胞成像技术,作者观察到ETV5等转录因子形成的斑点具有球形结构,能够融合并在光漂白后恢复,这表明它们参与了动态的分子间相互作用(图 3B)。此外,这些转录因子斑点占据独特的核域,与已知的染色质抑制和激活区域不同(图 3C和3D)。通过体外重组蛋白系统,作者发现ETV5能够与Pol II(CTD)发生相互作用(图3E),但其强度弱于MED1(IDR)和其他强激活因子(图 3G)。
为了进一步探究这些转录因子的功能,作者开发了一种基于dCas9的种子系统,能够在特定基因组位置核聚凝聚体因素,并通过域/探针分析验证了ETV5等转录因子能够形成选择性限制其他因素的核域(图3H)。这些转录因子不仅对同型探针具有亲和力,而且对异型探针如MED1(IDR)具有选择性限制。
因此,作者建议将这些TFs称为凝聚态双作用TFs。
凝结成双作用 TF 调节稳定的中级转录
作者的研究表明,特定的凝聚体形成双作用转录因子(TFs)具有独特的调控基因表达的能力,能够在中等水平上同时进行激活和抑制。这些转录因子通过dCas9-6xMCP技术在基因组上的特定位置进行定位,能够将高表达基因的表达水平下调,同时将沉默基因的表达水平上调,达到中等水平(图4A)。这种调控机制不同于传统的激活因子或抑制因子,它们显示出基于表达水平阈值的开关效应,而不是依赖于共抑制途径(图 4B)。
此外,这些双作用TFs在功能上与传统的弱激活因子或弱抑制因子不同。实验证明,它们能够显著激活报告基因,并且在系到高表达的内源基因上时,并不抑制这些基因,而是轻微增强了它们的表达(图4C和4D)。
作者还探讨了双作用TFs形成凝聚体的潜在功能,提出凝聚体可能作为一种噪声缓冲机制,通过限制凝聚体内浓度波动,减少对外部变化的敏感性(图 4E)。通过数学模型和实验验证,作者发现当双作用TF浓度达到凝聚体形成阈值时,转录输出会迅速达到一个稳定水平,即使TF浓度进一步增加,转录水平也能保持相对稳定。这与传统的弱激活因子驱动的报告基因输出相比,显示出更高的稳定性。总之,这些结果将凝集形成的双重作用 TF 定位为一种独特的表达水平调节 TF 类。
作者的研究挑战了转录因子(TFs)作为弱调控因子的传统观点,特别是针对能够形成凝聚体的双作用TFs。通过实验,作者发现这些双作用TFs与传统的弱激活因子或弱抑制因子不同(图 5A),它们能够在质粒基础的报告系统中显著激活报告基因,而不是预期的弱激活或弱抑制效果(图 5B)。这些双作用TFs展现出独特的调控特性,不仅在中等表达水平上进行转录调控,还具有更高的稳定性。
此外,作者提出了凝聚体形成可能为双作用TFs提供了一种噪声缓冲机制,减少对外部变化的敏感性(图 5C)。通过数学模型和实验验证,作者发现当双作用TFs的浓度达到一定阈值并激活报告基因后,即使TFs的浓度大幅增加,报告基因的表达水平也能保持相对稳定,这与弱激活因子驱动的系统形成鲜明对比(图 5D)。
作者的研究揭示了双作用TFs在转录调控中的新颖作用,它们不仅具有激活和抑制的双重功能,还可能通过凝聚体的形成提供转录调控的稳定性,这些特性使它们在真核生物的基因表达调控中发挥着重要的作用。
在 IDR 域编码双重功能
作者的研究深入分析了转录因子(TFs)的内在无序区域(IDRs)对其双重转录调控功能的影响。通过构建缺失IDRs的双作用TF突变体,作者发现IDRs对于这些TFs的激活和抑制功能至关重要。特别是在FUBP1和ZIC3这两个含有两个IDR结构域的TFs中,仅含有完整IDR结构域的突变体能够表现出双重效应,而只含有单个IDR结构域的突变体功能显著降低。这些结果揭示了IDRs在双作用TFs中所扮演的核心角色,表明其分子间相互作用的差异性是实现TFs复杂调控功能的关键。
进一步地,作者探索了ETV5 IDR中的功能序列单元,发现其含有分散的激活和抑制单元。尽管删除了包含激活单元的序列片段,ETV5突变体仍能保持对报告基因的激活能力,并表现出显著的转录稳定性。这表明双作用TFs的双重效应不单纯是由这些序列单元的组合所决定,而是可能涉及更复杂的分子机制(图6B-6D)。
作者的研究通过一系列实验揭示了转录因子(TFs)的序列特征对其凝聚体形成能力和双重调控功能的重要作用。通过突变分析,作者发现影响ETV5凝聚体形成能力的突变,如去除类朊病毒结构域(PLD),会减弱其在沉默基因上的激活和高表达基因上的抑制功能(图6B-6D)。此外,通过在ETV5上附加麦芽糖结合蛋白(MBP)标签,作者发现在低浓度下凝聚体形成和双重调控能力减弱,但在高浓度下这些功能得以保留,这进一步证实了凝聚体形成序列对调控潜力的重要性(图6E)。
作者还探讨了电荷模式在双作用TFs中的作用,通过在FUBP1、ZIC3、PITX2和ETV5中引入模式化电荷块,发现这种改变以序列上下文依赖的方式影响了TFs的相互作用和分配。这些结果表明,整体电荷模式和IDR序列单元共同影响双作用TFs的功能(图6F)。
最后,作者研究了与心脏畸形和肿瘤相关的双作用TF变异体,发现这些变异体在IDR域中的小缺失或无义突变导致核域选择性改变和调控功能的降低(图7A-C)。这些临床变异体表现出不同程度的活性降低,其程度与相关发育障碍的严重性相关联。
综上,作者的研究强调了对双作用TFs的IDR域进行全面分析的必要性,以理解其在转录调控中的作用。这些发现不仅为转录调控的分子机制提供了新的见解,也为相关疾病的分子病理学研究提供了可能的新方向。
凝结形成双重作用的TF稳定地调节发育功能
作者通过在小鼠胚胎干细胞中对双功能转录因子(TFs)的表达和定位进行分析,揭示了这些因子在细胞核中的特定分布模式。利用ChIP-seq技术,研究了这些TFs的染色质结合特性,发现它们与已知的转录调控因子和异染色质标记存在空间上的分离(图7D,7E)。特别是,ETV5这一双功能TF在染色质上的定位与其他因子显著不同,表明其可能在调控基因表达中扮演独特角色(图7F-7H)。此外,其他具有凝聚体形成能力的双功能TFs也表现出类似的分布模式,暗示这类TFs可能在细胞发育和基因调控中发挥重要作用。
作者通过在小鼠胚胎干细胞中调节双功能转录因子(TFs)的水平,揭示了这些因子在干细胞维持和分化过程中的重要作用。通过RNA测序技术,发现过度表达这些TFs仅引起轻微的转录组变化,其中上调基因主要与干细胞维持相关,而下调基因与发育过程相关,表明双功能TFs可能有助于维持干细胞的稳定状态。相反,通过shRNA技术敲减这些TFs,导致了与多种分化过程相关的广泛转录变化,其中大多数变化表现为基因表达的上调(图7I)。
进一步的单细胞RNA测序分析显示,双功能TFs的下调导致其靶基因去抑制,这些靶基因的表达与TFs的表达水平呈负相关。特别是,具有较高TF基序密度的靶基因显示出更强的相关性,并且这些基因在TFs水平正常时表达水平稳定,变异度低,而TFs水平降低时变异度增加。这些发现表明,双功能TFs通过精确调控靶基因的表达,对干细胞的分化和发育过程具有重要影响,强调了它们在细胞命运决定中的关键作用。
讨论
作者的研究揭示了基因表达水平的精确调控对正常细胞功能至关重要,其中转录因子(TFs)扮演着关键角色。传统上,TFs主要通过激活或抑制基因表达来发挥作用,一些双功能TFs能够通过招募不同的辅因子来响应细胞环境的变化。然而,如何实现在中等水平上稳定控制基因表达的机制一直不明确。本研究首次发现了能够形成凝聚体并调节基因表达水平的双功能TFs。这些TFs与典型的TFs、效应单元和双功能调节因子不同,它们能够在不依赖于传统的共抑制子或激活子的情况下,通过阈值依赖的方式在两种作用模式之间切换,以调节中等水平的表达。最引人注目的是,这些形成凝聚体的双功能TFs能够维持稳定的表达水平,对广泛的剂量变化具有鲁棒性。这一发现为调控机制增加了一个强大的层面(见图7J)。这些TFs可能以组合方式运作,调节中等范围内的表达水平,为进一步研究提供了方向。