问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

基因组选择育种:二十年关键因素综述

创作时间:
作者:
@小白创作中心

基因组选择育种:二十年关键因素综述

引用
搜狐
1.
https://www.sohu.com/a/768569155_121124027

随着全基因组测序技术的普及,基因组选择(Genome Selection, GS)作为一项关键技术,在育种中的应用越来越广泛。GS通过分析基因组信息来预测育种材料及其后代的表现,可在幼苗期评估个体的农艺性状。与传统育种相比,GS具有高准确性和较短的育种周期,从而提高了植物育种效率。

2024年3月12日,瑞典Rodomiro Ortiz团队在《Molecular Plant》发表题为“Genomic selection in plant breeding: Key factors shaping two decades of progress”的综述文章。该论文总结了最近20年基因组选择育种的影响因素和重要进展。

在GS过程中,首先需要获得群体的基因组变异信息和表型数据。然后通过模型构建和优化,获得变异信息和表型数据的关联性。最后,对新的育种群体的个体进行基因组序列分析,预测个体的表型,从而实现基因组选择(图1)。本文全面概述了影响植物育种中基因组预测(Genomic Prediction,GP)的关键因素,包括交叉验证方法,训练数据的大小和结构和遗传多样性等方面。其中,深入探讨了训练群体规模和遗传多样性的关键作用,以及它们与育种群体之间的关系,以实现GP的准确性(图1)。


图1 GS的概况和影响基因组预测的关键因素

该文章特别强调了优化训练群体规模的重要性,探讨了其超过最佳规模后的递减回报 (图2)。在考虑资源有限性和预测准确性之间的平衡后,可实现最优的表型预测。此外,单核苷酸多态性的密度和分布、连锁不平衡的水平、遗传复杂性、性状遗传力、机器学习方法和非加性效应也是影响表型预测的重要因素。其中,作者以小麦、玉米和马铃薯为例,总结了这些因素对不同性状的GP准确性的影响。


图2 群体数据训练的优化

在模型算法方面,可分为参数模型、半参数模型和非参数模型。其中,参数模型包括线性模型和贝叶斯模型等类型,而非参数模型则包括深度学习在内的机器学习方法(图3)。为了在基因组预测中实现高准确性,理论上使用Pearson相关性作为度量标准时效果最优。然而,这仍然是一个值得研究的活跃领域。作者推测,借助超大规模的基因型和表型数据集、有效训练群体的方法优化以及其他组学方法(转录组学、代谢组学和蛋白质组学)的支持,再加上深度学习算法,可以克服当前限制的边界,实现最高可能的预测准确性,使基因组选择成为植物育种中的有效工具。


图3 基因组预测的统计方法

总之,该综述总结了影响基因组选择育种的关键因素,包括群体数据采集,表型-环境的互作和统计模型等方面,并提出了潜在的优化方向。未来,随着全基因组测序成本的持续下降,加上高通量的表型数据采集和多种优化的计算模型,高效的全基因组选择育种将变得可能。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号