问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

GametesOmics:人类和小鼠生殖细胞发育的多组学数据库

创作时间:
作者:
@小白创作中心

GametesOmics:人类和小鼠生殖细胞发育的多组学数据库

引用
51CTO
1.
https://blog.51cto.com/u_16077014/10151491

近日,Genomics, Proteomics & Bioinformatics (GPB)在线发表了题为“GametesOmics: A Comprehensive Multi-omics Database for Exploring the Gametogenesis in Humans and Mice”的生殖细胞发育多组学数据库文章,该文章由北京大学第三医院生殖中心的研究团队独立完成。

要点介绍

研究问题

近年来,单细胞测序技术快速发展,提供了大量的组学数据,为探究配子发生过程的调控机制提供了极具价值的数据资源。然而,目前尚缺乏对配子发育过程的、来自不同研究的多组学测序数据的系统分析与整合,这极大地限制了这些数据的使用和深入挖掘。因此,亟待建立一个多组学数据库,以更好地帮助研究人员获得和挖掘这些多组学信息。

研究方法

我们通过文献检索,获得了包含人类和小鼠配子发生的单细胞测序数据集。考虑到数据质量和可比性,我们尽可能选择覆盖发育阶段最完整、样本数量最多和测序方法最先进的数据集,并使用统一的分析流程对其进行处理和整合。

主要结果

我们构建了人类和小鼠生殖细胞发育时期多组学数据库GametesOmics。我们使用统一的生物信息学标准化分析流程,全面整合了包括转录组、DNA甲基化、染色质开放性在内的多组学信息,涵盖了精子和卵子发育过程中的各个阶段。GametesOmics还提供了多样化的工具,帮助研究人员使用和挖掘多组学数据,探索人类和小鼠配子发育过程中的关键因子,挖掘配子发生过程中细胞命运决定的调控机制。

引言

配子发生是物种繁衍和进化的关键过程,涉及遗传和表观遗传学变化等复杂的分子调控机制。单细胞测序技术的快速发展推动了我们对配子发生过程的研究和理解,并提供了大量多组学数据。然而,针对不同测序平台和测序方法得到的数据,很难对其综合利用分析,这极大阻碍了对卵子和精子发生的分子机制的探索,亟需构建一个包含生殖细胞各个发育阶段的多组学数据库。因此,我们开发了一个针对人类和小鼠卵子和精子发生的多组学数据库GametesOmics(http://gametesomics. cn/)。

数据库简介

GametesOmics整合了人类和小鼠卵细胞发育过程中不完全生长的卵母细胞(non-growing oocytes, NGO)、生长期卵母细胞(growing oocyte, GO)、完全生长的卵母细胞(fully grown oocytes, FGO);以及精子发生过程中的精原细胞干细胞(spermatogonia stem cell)、精原细胞(spermatogonia)、精母细胞(spermatocyte)、精子细胞(spermatid)和成熟精子(mature sperm)的基因表达、DNA甲基化和染色质可及性数据。此外,数据库提供多种实用工具,可以用于查询和显示基因表达以及表观遗传修饰变化、执行差异分析、单细胞聚类分析、识别关键转录因子以及在基因组范围展示人类和小鼠同源基因的表达等。

数据库内容和功能

GametesOmics共包括66,267个细胞测序样本数据(数据库主体数据集共包括6689个样本数据,附加数据集共包括59,578 个样本数据),包括人类和小鼠精细胞和卵细胞发育的各个阶段(图 1A)。我们使用统一的生物信息学流程处理数据(图 1B),并开发了多种工具帮助研究多组学数据的协同变化和配子发生过程中的调控机制(图 1C)。


图1 GametesOmics数据库的构建和功能

Search和Advanced Search工具可以帮助用户检索特定基因的表达和表观遗传修饰变化。用户可以直接在Search搜索框输入基因名称,就可以得到该基因的基本信息,以及该基因随着生殖细胞发育过程的表达量变化,启动子的甲基化水平或开放性水平。Advanced Search工具支持用户一次输入多个基因,展示多个基因的表达或表观修饰水平和共表达的趋势。

除了展示功能,数据库也提供了一些分析工具。Tools模块下的DEG analysis,可用于识别不同阶段间的差异基因,在选择框里选择物种、配子类型和需要差异分析的发育阶段,可以筛选得到两个阶段之间的差异基因,同时得到常用的可视化结果,包括火山图、差异基因的GO 和PATHWAY富集等,帮助我们筛选有决定细胞命运潜能的关键基因;Visualization工具用于描绘细胞发育轨迹,并筛选各个发育阶段的关键转录因子;Correlation analysis工具可以很好地实现多组学数据的结合,用户可以通过输入数据类型和目标基因,同时呈现基因的表达水平、DNA甲基化、染色质开放性在不同发育阶段的变化趋势,展示基因表达水平与表观修饰水平的协同变化,反映多组学数据的相关性,帮助我们深入理解调控基因表达的具体分子机制;MethylView提供了对DNA甲基化位点或染色质可及性lollipop展示图,用户可以直接查看内含子、外显子、基因间区等任何区域的表观遗传修饰水平,从而研究表观遗传调控。

除上述功能外,该数据库还包含基因组可视化工具。Genome Browser和Ortholog可以实现人类和小鼠基因组目标区域的多组学信息可视化,在输入框中选择阶段和数据类型,并选择基因组位置,从而获得人和小鼠同源区段该位置的转录、DNA甲基化和染色质开放性的富集情况。因此,该模块可以很好地为小鼠作为实验模型开展功能研究提供参考。

数据库应用

1. 筛选人类和小鼠精子发育的关键调控因子

精子发生过程主要包括精原细胞增殖分化、精母细胞减数分裂和精子减数分裂后发育变形过程。减数分裂后的发育变形包括顶体和鞭毛的形成、染色质的凝集、多余细胞质的清除以及向精子的转变过程等,取决于许多基因的精确调控。然而,关于该过程的关键调控因子的报道却很有限。我们通过Visualization工具绘制小鼠的单细胞精子发育轨迹UMAP聚类图显示其处于精子发生轨迹的末端(图2A)。气泡图显示,该阶段特异性基因的启动子富含RFX2调控序列,且Rfx2在精子中高表达(图2B和 C)。先前的研究发现,Rfx2-/-雄性小鼠的精子发生阻滞。圆形精子不能生成鞭毛,也不能变形分化成成熟精子,同时大量与精子发生相关的基因表达发生改变,最终导致精子凋亡。RNA-seq和ChIP-seq分析鉴定了精子发生过程中Rfx2直接调控的基因,发现这些基因参与纤毛功能、细胞骨架重塑和细胞粘附,这表明RFX2是圆形精子分化和鞭毛产生的重要TF,这验证了数据库的准确性。

人类精子变形时期轨迹也处于UMAP轨迹的末端(图 2D)。我们利用Visualization功能找到该阶段关键 TF。我们发现ATF2在人类精子中高表达且富集(图2E和F)。我们从 Cistrome 数据库(http://cistrome.org/db/)中下载了ATF2的下游靶基因。其中包括与精子发育有关的调控基因,如PACRG、MORN3、GAPDH和CREM。我们将上述基因输入高级搜索工具,结果发现这些基因在人类精子变形时期表达上调(图 2G)。研究表明这些基因对精子的正常变形和发育非常重要。因此,GametesOmics 筛选出的ATF2很有可能是人类精子减数分裂后发育变形时期的关键调控因子。


图2 筛选人类和小鼠精子变形时期的关键调控因子

2. 筛选人类和小鼠卵母细胞生长的关键基因

哺乳动物中卵母细胞生长过程中会经历转录和翻译的爆发,以达到其完全生长时期的大小,该过程被认为是受精和胚胎发生的基础之一。与FGO相比, GO1处于快速生长的动态阶段。因此,GO1中高表达的基因对人类和小鼠的卵子发生至关重要。然而,人与小鼠之间基因表达的保守性和差异性以及表观遗传修饰还需要进一步研究。

为了探索人类和小鼠卵母细胞生长时期的关键调控基因,我们利用 GametesOmics 中的DEGs analysis工具筛选获得GO1和FGO之间的差异基因DEGs(图 3A和B)。GO分析表明,人类特有的DEGs富集在 “蛋白质转运”、“蛋白质折叠”和 “核糖体生物发生”等功能中,而小鼠特有的DEGs富集在 “多细胞生物发育”、“凋亡过程的负调控”和“染色体组织”等功能中(图3C和D)。人类和小鼠的共有的DEGs 在“转录正向调控”、“增殖”和“生长因子信号转导”等功能富集,这意味着它们可能在人类和小鼠的卵母细胞生长过程中保守表达并发挥作用(图3E)。其中,SIRT1与增殖代谢、DNA 修复和生殖衰老有关;Smad4条件性敲除小鼠会卵泡数和排卵率减少;ESR2编码一种重要的雌激素受体,据报道与卵泡发育和排卵有关。通过Orthologs工具,我们还发现了它们在人类和小鼠中具有不同的表观遗传修饰情况,表明它们在调控方式上,可能存在物种之间的差异性(图3F-H)。


图3 筛选人类和小鼠卵母细胞生长时期的关键基因

总结和展望

GametesOmics专门整合人类和小鼠卵子和精子发育过程中的多组学信息。我们使用统一的流程分析和处理了测序数据,以此更好地实现对不同数据集的量化和比较。GametesOmics提供了多样化工具,便于用户根据研究需求,分析和挖掘这些测序数据。

GametesOmics将帮助研究人员从多组学角度剖析生殖细胞发育的分子调控机制,促进对代际遗传和表观遗传的探索,还有望为临床上生殖障碍和遗传疾病的诊断提供线索。未来随着配子发生领域研究的发展,GametesOmics 将不断更新,整合更多单细胞遗传和表观遗传测序数据。此外,我们还将根据用户反馈优化和扩展功能,尽可能为用户提供更便捷的应用,为生殖细胞发育的相关研究提供更多支持。

参考文献

An J, Wang J, Kong S, Song S, Chen W, Yuan P, et al. GametesOmics: A Comprehensive Multi-omics Database for Exploring the Gametogenesis in Humans and Mice. Genomics Proteomics Bioinformatics 2023. https://doi.org/10.1093/gpbjnl/qzad004.

英文全文详见:https://academic.oup.com/gpb/advance-article/doi/10.1093/gpbjnl/qzad004/7491597

作者及资助信息:
北京大学第三医院生殖中心的安建婷博士王静博士后为该文共同第一作者,北京大学第三医院生殖中心的乔杰院士严智强副研究员闫丽盈教授为该文通讯作者。该项目得到国家自然科学基金、国家重点研发计划和北京市自然科学基金等项目的支持。

GPB论文:
GametesOmics: A Comprehensive Multi-omics Database for Exploring the Gametogenesis in Humans and Mice

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号