单细胞CRISPR筛选:探索基因功能和细胞异质性的利器
单细胞CRISPR筛选:探索基因功能和细胞异质性的利器
单细胞CRISPR筛选技术是一种高通量、大规模研究单细胞水平中基因表达谱以及CRISPR介导扰动表型的解决方案。它克服了传统bulk全基因组CRISPR只能评估细胞间的平均表达水平掩盖细胞间异质性的局限性。通过结合全基因组CRISPR筛选和单细胞CRISPR筛选,科学家们能够鉴定出抵抗新冠病毒感染的基因和药物靶标。
基于10x Genomics Chromium平台的单细胞CRISPR筛选,提供了一种高通量、大规模研究单细胞水平中的基因表达谱以及CRISPR介导扰动表型的解决方案,克服了传统bulk全基因组CRISPR只能评估细胞间的平均表达水平掩盖细胞间异质性的局限性。单细胞CRISPR筛选主要用于对单个细胞进行基因编辑,通过将CRISPR系统(包括Cas蛋白和特定的gRNA)引入单个细胞中,以精确地修改该细胞的基因组,从而能够在单细胞水平评估多个基因的扰动效应。这种方法适用于研究基因功能、细胞特异性反应等领域。比如说,不同的细胞类型对基因编辑的反应可能不同。通过单细胞CRISPR,科学家可以研究特定细胞类型中基因功能的特异性,这对于理解细胞分化、发育和疾病状态中的细胞异质性非常重要。我们通常在确定小部分目标基因后,定制相应的sgRNA,使用慢病毒文库感染细胞,并通过FACS和抗生素挑选表达sgRNA阳性细胞,对筛选后的细胞通过10×平台进行捕获建库,然后进行单细胞CRISPR测序,接着分析测序结果,进行差异表达基因筛选以及功能富集分析,以揭示基因编辑的生物学效应。
接下来,我们解读一篇2020年发表在cell上的文章,通过结合全基因组CRISPR筛选和单细胞CRISPR筛选鉴定出抵抗新冠病毒感染的基因和药物靶标。
研究概况
为了更好地了解宿主-病毒遗传依赖性并找到COVID-19的潜在治疗靶点,研究人员进行了基因组规模的CRISPR功能缺失筛选,以确定SARSCoV-2病毒感染人肺泡上皮细胞所需的宿主因子。排名靠前的基因聚集成不同的途径,包括液泡atp酶质子泵,Retromer和Commander复合物。研究人员使用几种正交方法验证这些基因靶点,如CRISPR敲除、RNA干扰敲除和小分子抑制剂。使用单细胞rna测序,研究人员确定了在失去顶级基因时胆固醇生物合成的共同转录变化。此外,考虑到ACE2受体在病毒进入的早期阶段的关键作用,研究人员发现RAB7A的缺失通过隔离细胞内的ACE2受体来减少病毒进入。总的来说,这项工作提供了基因组规模的定量资源,研究了每个宿主基因缺失对病毒感染适应性/反应的影响。
研究结果
1. 高通量筛选鉴定SARS-CoV-2感染所需基因
为了确定SARS-CoV-2感染所需的关键基因,研究人员使用GeCKOv2 CRISPR-Cas9文库对人类基因组中的19050个基因进行了基因组规模的功能缺失筛选。GeCKOv2文库包含122,411个CRISPR单引导rna (sgRNAs)(每个基因6个引导rna),先前已用于CRISPR筛选耐药,免疫治疗,合成致死性,线粒体疾病和肌肉萎缩症的治疗发现。首先,研究人员用一个包含Cas9、GeCKOv2人源文库中的引导rna和一个嘌呤霉素耐药基因的all-in-one慢病毒载体转导了一个组成性表达ACE2(称为A549ACE2)的人肺泡基底上皮癌细胞系(A549)。在低感染多重度(MOI 0.2)下进行转导,以确保大多数细胞只接受一种引导RNA构建(图1A)。然后使用 puromycin 进行筛选。接下来,研究人员用SARS-CoV-2病毒感染 A549ACE2 细胞,并测量细胞存活率。通过扩增子测序,量化每个生物条件下 sgRNA 的丰度(图1A)。对guide RNAs进行robust-rank aggregation(RRA)相对富集分析,鉴定出约1000个显著富集的基因。
图1.基因组级CRISPR功能缺失筛选鉴定阻止SARS-CoV-2感染人肺泡上皮癌细胞的基因
2. 富集基因参与病毒生命周期的多个方面,并广泛表达
对富集基因进行深入分析,发现了参与病毒进入和复制的基因,例如 ACE2 受体。在排名前 50 的富集基因中,识别出多个功能相关的基因集,例如 ARP2/3 复合物、vATPase 质子泵复合物、Retromer 复合物等。这些基因集参与病毒进入、膜融合、内体循环、ER-Golgi 运输和转录调控等关键过程。基因集富集分析 (GSEA) 显示,显著富集的 GO 条目包括内体加工、运输和酸化,以及与细胞分裂和病毒附着相关的条目。尽管筛选在人肺细胞中进行,但分析了排名靠前的基因在 12 种组织中的表达情况,发现这些基因在多种组织中广泛表达。只有 ACE2(即已知负责结合SARS-CoV-2病毒刺突蛋白的受体)显示出组织特异性表达,在睾丸、小肠、肾脏和心脏中富集。这表明这些机制可能独立于细胞或组织类型发挥作用。
图2.CRISPR筛选中排名靠前的基因参与了SARS-CoV-2病毒生命周期的关键要素
3. 富集的基因被认为与病毒蛋白相互作用,对其他病毒病原体也是必需的
根据前期研究中利用串联质谱分析确定的332个高置信度的SARS-CoV-2-human protein-protein interactions (PPIs),发现本研究中loss-of-function筛选中得到的一些排名靠前的几个宿主基因直接与这种病毒自身的蛋白相互作用,这突显了它们在病毒生命周期中的核心作用。还对SARS-CoV-2,寨卡病毒(ZIKV)和大流行性禽流感(H1N1 IAV)top-ranked GO biological processes进行聚类分析,发现SARS-CoV-2和ZIKV富集基因的GO相似性较大。
图3.富集基因聚集成相关通路,广泛表达
4. SARS-CoV-2筛选的阵列验证和可用药基因靶点的识别
在完成初步筛选后,本研究挑选了RRA分析中排名前200位基因中的30个基因, 对基因丢失阻止 SARS-CoV-2病毒感染的能力进行验证。使用 CRISPR 敲除 A549ACE2 细胞中的目标基因,并感染 SARS-CoV-2 病毒。研究发现Cas9扰乱的细胞系与非靶向sgRNA的细胞系比较,感染细胞的百分比降低。其中有对SARS-CoV-2感染提供最大保护的基因包括囊泡运输基因,如基因RAB7A、CCDC22和VPS35。通过交叉参考 CRISPR 筛选结果和 Drug Gene Interaction 数据库 (DGIdb),鉴定出 69 个可成药基因。
图4.与病毒蛋白直接相互作用,并参与大流行性流感和寨卡病毒的病毒发病
5. 单细胞CRISPR测序识别脂质和胆固醇调节的靶基因
为了了解在功能缺失筛查中发现的这些基因的丢失如何预防SARS-CoV-2感染的机制,以及宿主基因缺失是否会改变细胞转录程序。为全基因组crispr筛选出的Top30目标基因设计sgRNA进行单细胞CRISPR测序(最近开发的一种将大规模CRISPR编辑与单细胞RNA测序(ECCITE-seq)相结合的技术),将含有non-targeting guide RNAs的细胞和含有targeting guide RNAs的细胞进行差异基因表达分析,鉴定出11个扰动下游差异表达的靶基因。研究发现,6个靶基因(ATP6AP1、ATP6V1A、CCDC22、NPC1、PIK3C3和RAB7A)的缺失在上调的差异表达基因中产生了相似的基因表达特征(图6B),这些基因是内体进入途径的一部分。总结基因集富集分析结果的热图,发现这6个靶基因扰动均导致影响脂质和胆固醇稳态的途径上调(图6C)。为了了解这些变化如何影响脂质产生,研究测量了CRISPR扰动后细胞中的胆固醇水平,发现这些基因的丢失会使胆固醇增加10%至50%,这取决于扰动的程度(图6D)。研究发现氨氯地平作为一种钙通道拮抗剂,能够上调细胞胆固醇水平,从而阻断 SARS-CoV-2 感染。鉴于近期临床研究显示,服用钙通道阻滞剂的患者 COVID-19 病例死亡率下降,未来一个重要的研究方向将是深入阐明胆固醇合成途径与SARS-CoV-2之间的关系。
图6.单细胞转录组学(ECCITE-Seq)鉴定脂质和胆固醇调节的共同靶基因特征
6. RAB7A 缺失导致细胞表面表达减少和 ACE2 在内体内积累增加
基于之前关于刺突蛋白突变和病毒通过ACE2受体进入人体细胞的研究,作者们进一步探讨了某些基因的缺失是否可能通过降低 ACE2 水平来赋予 SARS-CoV-2 抵抗力。他们特别发现 RAB7A 基因对 ACE2 转运到细胞膜上具有重要影响。通过结合使用流式细胞仪和共聚焦显微镜,他们观察到RAB7A的缺失会阻断细胞表面上的 ACE2 受体,从而阻止病毒进入。
图7.RAB7A缺失导致细胞表面表达减少和内体ACE2积累增加
这项研究不仅揭示了SARS-CoV-2感染的关键宿主因子,还为开发针对COVID-19的治疗策略提供了重要线索。通过结合全基因组CRISPR筛选和单细胞CRISPR筛选,研究人员能够更全面地理解病毒与宿主之间的相互作用,为未来抗病毒药物的研发开辟了新的方向。