问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

技术突破：清华团队实现RTX 4090单卡运行671B大模型

创作时间:

作者:

@小白创作中心

技术突破：清华团队实现RTX 4090单卡运行671B大模型

引用

1

来源

1.

https://finance.sina.cn/2025-02-15/detail-inekqiwa5510042.d.html

清华大学KVCache.AI团队联合趋境科技在大模型推理算力领域取得重大突破。最新发布的KTransformers开源项目支持在单张RTX 4090显卡（24G显存）上运行DeepSeek-R1、V3的671B满血版，这一突破性进展不仅大幅降低了大模型的使用门槛，也展示了开源精神与硬件潜能结合的巨大潜力。

据国内媒体报道，清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目迎来重大更新，成功打破大模型推理算力门槛。

此次KTransformers项目更新带来重大突破，支持在24G显存（4090D）的设备上本地运行DeepSeek-R1、V3的671B满血版。

KTransformers项目的核心在于异构计算策略：

稀疏性利用：MoE架构每次仅激活部分专家模块，团队将非共享的稀疏矩阵卸载至CPU内存，结合高速算子处理，显存占用压缩至24GB。
量化与算子优化：采用4bit量化技术，配合Marlin GPU算子，效率提升3.87倍；CPU端通过llamafile实现多线程并行，预处理速度高达286 tokens/s。
CUDA Graph加速：减少CPU/GPU通信开销，单次解码仅需一次完整的CUDA Graph调用，生成速度达14 tokens/s。

这一突破带来的影响是显著的：

传统方案：8卡A100服务器成本超百万，按需计费每小时数千元。
现在：单卡RTX 4090方案整机成本约2万元，功耗80W，适合中小团队与个人开发者。

NVIDIA RTX 4090运行DeepSeek-R1满血版的案例，不仅是技术奇迹，更是开源精神与硬件潜能结合的典范。它证明：在AI狂飙的时代，创新往往源于对"不可能"的挑战。

热门推荐

不较劲、不纠结：中医专家解析心态与健康的关系

不较劲、不纠结：中医专家解析心态与健康的关系

立夏养生重在养心：饮食作息情绪全攻略

立夏养生重在养心：饮食作息情绪全攻略

调整到省电模式：人生下半场的四大节能法则

调整到省电模式：人生下半场的四大节能法则

5种点心制作秘决！虾饺皮晶莹剔透原来是靠这样

5种点心制作秘决！虾饺皮晶莹剔透原来是靠这样

汉字为什么没有发展成拼音文字？汉字的起源与特点

汉字为什么没有发展成拼音文字？汉字的起源与特点

学写汉字需要掌握：运用田字格、练习、笔顺/笔画以及APP

学写汉字需要掌握：运用田字格、练习、笔顺/笔画以及APP

中世纪贵族女性修道现象：既是信仰选择也是家族策略

中世纪贵族女性修道现象：既是信仰选择也是家族策略

战火中的坚守：黎巴嫩修女提供紧急医疗救助

战火中的坚守：黎巴嫩修女提供紧急医疗救助

张真源加入《奔跑吧》，八人团开启茶马古道冒险

张真源加入《奔跑吧》，八人团开启茶马古道冒险

广东妹子在江苏扬州玩了五天四晚，说说对扬州旅游的14条建议

广东妹子在江苏扬州玩了五天四晚，说说对扬州旅游的14条建议

收视率破4.83，黄晓明加盟让《奔跑吧》重返巅峰

收视率破4.83，黄晓明加盟让《奔跑吧》重返巅峰

邓超回归《奔跑吧》，节目组需创新应对挑战

邓超回归《奔跑吧》，节目组需创新应对挑战

《奔跑吧兄弟》第十二季启航：新老成员混搭能否重振收视？

《奔跑吧兄弟》第十二季启航：新老成员混搭能否重振收视？

十大出门一日游必备物品有哪些一日游带点什么东西

十大出门一日游必备物品有哪些一日游带点什么东西

【元朗好去处】元朗一日游必试美食、单车径、露营车、元朗酒店推介

【元朗好去处】元朗一日游必试美食、单车径、露营车、元朗酒店推介

2025年实施延迟退休，灵活就业者社保迎来新挑战

2025年实施延迟退休，灵活就业者社保迎来新挑战

刘炳森隶书独步当代书坛，看看他的这些成名作吧

刘炳森隶书独步当代书坛，看看他的这些成名作吧

年会主持词：如何让开场白炸场？

年会主持词：如何让开场白炸场？

年会主持词攻略：如何通过主持词提升员工凝聚力？

年会主持词攻略：如何通过主持词提升员工凝聚力？

龙龙鱼府年会主持词：展现企业文化的秘诀

龙龙鱼府年会主持词：展现企业文化的秘诀

天车作业“十不吊”，守护安全生产底线

天车作业“十不吊”，守护安全生产底线

郑恺成《奔跑吧》“表情包工厂”，元老级成员展现多面魅力

郑恺成《奔跑吧》“表情包工厂”，元老级成员展现多面魅力

天车作业“十不吊”，安全指南了解一下？

天车作业“十不吊”，安全指南了解一下？

天车十不吊：工地安全的生命线

天车十不吊：工地安全的生命线

工业安全再敲警钟：从“十不吊”看起重作业安全

工业安全再敲警钟：从“十不吊”看起重作业安全

天车十不吊：安全操作的生命线

天车十不吊：安全操作的生命线

奔跑吧茶马古道篇：7天4城体验，白鹿金句引共鸣

奔跑吧茶马古道篇：7天4城体验，白鹿金句引共鸣

广电总局警示AI魔改视频风险，版权保护亟待加强

广电总局警示AI魔改视频风险，版权保护亟待加强

AI艺术创作版权归属：界定难题与应对之策

AI艺术创作版权归属：界定难题与应对之策

《奔跑吧》迎新阵容：迪丽热巴加盟，Angelababy回归

《奔跑吧》迎新阵容：迪丽热巴加盟，Angelababy回归

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号