中国科大突破图神经网络训练瓶颈,Capsule 系统性能提升 12 倍
创作时间:
作者:
@小白创作中心
中国科大突破图神经网络训练瓶颈,Capsule 系统性能提升 12 倍
引用
IT之家
1.
https://www.ithome.com/0/833/029.htm
2 月 11 日,中国科学技术大学苏州高等研究院医学影像智能与机器人研究中心 DDL 实验室宣布,团队在大规模图神经网络(GNN)训练系统方面的研究论文被国际知名学术会议 ACM International Conference on Management of Data(SIGMOD)2025 录用。
图神经网络(GNN)的主流训练框架,如 DGL 和 PyG,利用 GPU 的并行处理能力从图数据中提取结构信息,在推荐系统、自然语言处理、计算化学和生物信息学等领域展现出卓越性能。
尽管 GPU 在 GNN 训练中提供了强大的计算优势,但其有限的显存容量难以容纳庞大的图数据,因而现有 GNN 系统在大规模图数据上的扩展性方面仍面临挑战。
对此,DDL 实验室团队提出了一种新的核外(Out-of-Core)GNN 训练框架 ——Capsule,为大规模图神经网络训练提供了高效的解决方案。
与现有的核外 GNN 框架不同,该系统通过图划分和图裁剪策略将训练子图结构及其特征完全放入 GPU 显存之中从而消除了反向传播过程中 CPU 与 GPU 之间的 I/O 开销,进而显著提升了系统性能。
此外,Capsule 通过设计基于最短哈密顿回路的子图加载方式和流水线并行策略,进一步优化了性能。同时,Capsule 具备即插即用的特性,能够无缝集成至主流开源 GNN 训练框架中。在大规模真实图数据集上,Capsule 与现有最好的系统相比能够在仅使用 22.24% 的内存下带来最高 12.02 倍的性能提升,并提供了关于训练所得嵌入方差的理论上界。
这一成果标志着我国在图计算系统领域取得重要突破,为社交网络分析、生物医学图谱构建等需处理超大规模图数据的场景提供了全新解决方案。
热门推荐
紫微斗数:分析配偶长相的命理学指南
跨专业PMP认证必读:2025年报考条件全解析
肖邦"黑键练习曲":从音乐结构到电影改编
跑步前后的热身和拉伸:预防损伤与提升表现的科学指南
注意力机制——CBAM原理详解及源码解析
走进华为松山湖园区参观考察预约电话—华为南方工厂参访游学
几个月胎儿有胎动了
从仰韶与酒,读懂黄帝时期的中华文明
自制"永不落地"的纸飞机:原理与实践指南
解锁丹田气:传统养生的能量密码
为何抑郁的孩子更容易熬夜—解析背后的生理与心理原因
运动鞋与登山鞋清洗全攻略:从清洁到保养的7个步骤
这两种“网红”减肥法,可能正在伤害你
自我救助锦囊:生活是艘偏离航线的船——如何应对不确定性?
数据分析软件如何优化产品定价策略?
作文怎么样写好场景(写好场景的技巧)
长三角地区养老金大PK,谁最高?谁最少?
个人养老金到底“香不香”?听听宁波首批“吃螃蟹的人”怎么说
陕西地区唯一的一座藏传格鲁派寺院 西安广仁寺的美深入骨髓
“最终幻想是单机游戏吗?听说可以多人联机,是真的吗?”
ThinkPHP配置数据库连接池:从入门到实战
从零开始:ThinkPHP 入门教程,快速上手 Web 开发
劳动者社保补缴指引:了解补缴政策和操作流程
右手无名指关节疼痛的原因及护理方法
前端如何防止DNS劫持
肥胖之谜:中医辨证施治与崇文中方大阴阳理论的深度解析
心理学:喜欢的人不给你“正反馈”,只有3个原因
北印度和南印度在文化上有什么区别?印度的南北差异是怎样的?
网贷合同需要看那几点:法律实务中的注意事项与风险防范
中药人中黄是什么