西湖大学学者最新Science论文:解析迄今最完整小鼠基因组图谱
西湖大学学者最新Science论文:解析迄今最完整小鼠基因组图谱
北京时间2024年12月6日凌晨,《科学》(Science)杂志在线发表了西湖大学生命科学学院、西湖实验室俞晓春团队最新成果“完整的端粒到端粒小鼠参考基因组序列(The complete telomere-to-telomere sequence of a mouse genome)”,报道了该团队在解析小鼠参考基因组方面取得的重要突破。这意味着人类历史上第一次看清小鼠基因组DNA全貌。
论文截图
研究背景与意义
基因组学领域的一个重要研究目标是获得完整的、精确的基因组序列,这对于理解基因组的结构和功能至关重要。2022年3月31日,《科学》发表文章报道了名为“端粒到端粒联盟”的国际科学团队,完成了第一个完整的、无间隙的人类基因组序列,填补了2003年“人类基因组计划”遗留下的8%尚未读取的基因区域。
在大洋彼岸的中国浙江杭州的西湖大学,俞晓春实验室当时的博后、现在的助理研究员李麒麟及时关注到了这条新闻。这令这个团队感到无比振奋,因为他们日常“打交道”的小鼠身上,正存在相似的瓶颈。目前小鼠的基因“档案”中,最完整的是参考基因组GRCm39,同样也存在约7~8%未被解析的区域。
研究过程与技术突破
俞晓春团队综合了众多三代基因测序技术,让它们互相补足,开发了一把能够充分挖掘小鼠基因的“金铲子”。他们以最常用的小鼠C57BL/6的单倍体胚胎干细胞(mhaESC)为样本,进行了基因测序和组装,获得了长度为2.77 Gbp(表示十亿个碱基对)的完整的高质量小鼠参考基因组序列,其中包含215.23 Mbp(表示一百万个碱基对)先前未被鉴定的序列,填补了约7.7%的基因组空白。
这个过程涉及到了PacBio HiFi、Oxford Nanopore超长、Illumina短读长、Hi-C和BioNano光学图谱等多项基因测序技术。
重要发现
发现了新的蛋白质编码基因。与先前的参考基因组版本相比,本研究额外注释了639个蛋白质编码基因,其中先前未被发现的全新的蛋白质编码基因有140个。
较精确地“看清”核糖体DNA的基因序列。核糖体是细胞内的“蛋白质工厂”,负责合成蛋白质。核糖体DNA是细胞中的一种特殊DNA,它专门负责编码核糖体的RNA(rRNA)——一种核糖体的重要组成部分,帮助核糖体合成蛋白。
解析了着丝粒区域的基因序列详情。着丝粒是染色体上的一个特殊区域,帮助染色体在细胞分裂时,将遗传物质平均分配到两个新的细胞中。本研究的结果显示,小鼠各染色体之间的着丝粒长度具有明显差异,且序列内部富含转座元件和片段重复(SD),同时还有散在的基因分布,表明该区域可能会进行活跃的转录和转座事件,驱动着丝粒区域进行适应性改变等行为。
研究意义
这项研究不仅提高了对小鼠基因组结构和功能的理解,也为基因组学研究提供了重要的技术参考和数据资源。西湖大学俞晓春研究员表示,这项研究的顺利开展,既得益于俞晓春自在美国密歇根大学医学院内科系成为独立PI后,对染色体近20年的研究积累;同时,也与两位一作作者历经过的、作为一名科研工作者的磨炼与自我调整息息相关。
西湖实验室助理研究员刘俊丽博士和李麒麟博士为本文的共同第一作者,西湖大学生命科学学院科研副院长、西湖实验室科研副主任俞晓春教授为通讯作者。本研究得到国家自然科学基金、浙江省自然科学基金、浙江省“尖兵”&“领雁”项目、杭州市领军型创新创业团队、西湖教育基金会和西湖实验室提供的经费支持,同时感谢西湖大学生物医学实验技术中心、实验动物中心及高性能计算中心等平台的支持。
