北大团队开发新型测序技术,实现植物完整基因组高效组装
北大团队开发新型测序技术,实现植物完整基因组高效组装
近日,北京大学现代农业研究院李博生研究员团队在《Molecular Plant》期刊发表重要研究成果,开发了一种基于牛津纳米孔技术(ONT)的超长和选择性测序方法,能够高效获得植物完整端粒到端粒(T2T)基因组。该研究通过优化DNA提取和建库方法,成功实现了多个植物物种的高质量完整T2T组装,为植物基因组学研究提供了重要技术支持。
植物完整端粒到端粒(T2T)基因组的组装面临基因组复杂性的挑战,通过牛津纳米孔技术(ONT)长读长、实时测序的特性推动了植物完整T2T的组装。尽管该技术具有先进优势,但植物超长DNA提取、建库和填补组装后剩余gap仍然是重大挑战。
近日,北京大学现代农业研究院李博生研究员实验室在Molecular Plant在线发表了题为Nanopore Ultra-long Sequencing and Adaptive Sampling Spur Plant Complete Telomere-to-Telomere Genome Assembly的研究论文,该研究提供了基于牛津纳米孔平台(Oxford Nanopore Technology)实施超长DNA测序(N50 length > 100 Kb)和选择性测序(Adaptive Sampling)的方法能够高效率实现植物完整T2T基因组拼接。
超长测序在植物基因组组装中至关重要,该研究优化了DNA提取步骤,选择嫩植物组织,通过液氮或GentleMACS研磨并结合适当的裂解和清洗步骤,成功提取超过485 Kb的长DNA片段,为植物基因组测序提供了高质量的DNA。
图1 长片段DNA提取方法流程
通过减少DNA投入量、转座酶反应时间和反应量、改进文库DNA纯化步骤以及增加清洗步骤的手段,进一步对超长DNA的两种ONT建库方法(转座酶法和连接法)进行优化。结果显示优化方法显著提高了N50读长,最大N50达到440 Kb。
图2 ONT超长DNA文库构建的改进方法
该研究通过优化DNA提取和建库方法,该研究成功实现了多个植物物种的高质量完整T2T组装。多个物种的超长读取(N50 > 100 Kb)占比在70%-90%;测序平均N50读长为80.57 Kb,最长读长为5.83 Mb。
图3 优化的ONT测序方法增长了测序读长并维持了产出量
同时该研究证明了在组装过程中结合超长和选择性测序可以有效地填补未知序列的gap,成功实现拟南芥基因组剩余gap和西瓜中的未知端粒区域的填补,助力了多个已经发表的植物T2T基因组拼接。该研究的方法显著提高了植物完整T2T基因组装的可行性,将在多个领域增强基于完整基因组的研究。
图4 T2T基因组组装流程
综上,该研究建立了一种显著提高纳米孔测序读取长度的DNA提取和建库方法。证明了在T2T组装过程中应用选择性测序技术,对未知序列进行特异的富集测序,可以高效率的填补组装后最后几个gap和获得端粒序列,实现多数植物完整T2T基因组的拼接。该研究成果标志着植物超长DNA测序方法的重要改进,文章中详细的实验方法和经验描述有助于在各植物研究领域的快速推广和应用。