问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

香港大学新研究：LiT模型如何改变计算硬件需求？

创作时间:

作者:

@小白创作中心

香港大学新研究：LiT模型如何改变计算硬件需求？

引用

腾讯

等

10

来源

1.

https://new.qq.com/rain/a/20250131A038TS00

2.

https://blog.csdn.net/hero272285642/article/details/140916518

3.

https://cloud.baidu.com/article/3324078

4.

https://blog.csdn.net/qq_44681809/article/details/140827379

5.

https://blog.csdn.net/weixin_38739735/article/details/142756388

6.

https://blog.csdn.net/2401_84250575/article/details/137966880

7.

https://www.jiqizhixin.com/articles/2025-01-31-2

8.

https://www.bilibili.com/read/cv33716523/

9.

https://developer.volcengine.com/articles/7382359107094708261

10.

https://medium.com/@huangyihe/%E6%9C%AC%E5%9C%B0%E8%B7%91%E5%A4%A7%E6%A8%A1%E5%9E%8B-%E9%9C%80%E8%A6%81%E4%BB%80%E4%B9%88%E9%85%8D%E7%BD%AE-04832150eafb

01

研究背景与动机

在当前的AI技术发展中，扩散模型因其强大的图像生成能力而备受关注。然而，传统的自注意力机制由于计算复杂度较高，限制了其在高分辨率图像生成和端侧设备部署中的应用。针对这一挑战，香港大学研究团队提出了基于线性注意力的扩散模型LiT（Linearized Diffusion Transformer），旨在实现更高效的图像生成。

02

核心技术创新

研究团队从架构设计和训练策略两个维度对线性扩散Transformer进行了系统性研究。LiT的核心创新点包括：

极简线性注意力机制：研究发现，通过简化线性注意力的设计，可以有效提升扩散模型的图像生成性能。此外，线性注意力还具有一个"免费午餐"特性，即通过减少注意力头的数量，可以在增加理论计算量的同时不增加实际GPU延迟。
优化的训练策略：
- 权重继承：从预训练的Diffusion Transformer中继承权重，但不包括自注意力部分的权重。
- 知识蒸馏：采用混合知识蒸馏策略，同时蒸馏噪声预测结果和方差预测结果，以加速模型训练。

03

实验结果与应用

在标准ImageNet基准测试中，LiT展现出卓越的性能：

在ImageNet 256×256基准上，仅需DiT 20%的训练迭代次数即可达到相当的FID（Frechet Inception Distance）指标。
在ImageNet 512×512基准上，仅需DiT 23%的训练迭代次数即可实现相当的FID指标。

更值得关注的是，LiT-0.6B模型已经能够在Windows笔记本电脑上实现离线部署，断网状态下遵循用户指令快速生成1K分辨率的逼真图片，这为AIPC时代的到来提供了新的技术支撑。

04

未来展望

LiT的研究成果不仅展示了线性注意力在扩散模型中的巨大潜力，更为AI技术的端侧部署和商业化应用开辟了新的路径。随着技术的进一步优化，我们有望看到更多高性能、低功耗的AI应用在个人设备上实现，为用户带来更加便捷、智能的使用体验。

热门推荐

机器学习实战(2)：数据预处理——机器学习的第一步

机器学习实战(2)：数据预处理——机器学习的第一步

邓禹简介：东汉开国元勋的传奇人生

邓禹简介：东汉开国元勋的传奇人生

带除颤的起搏器叫什么

带除颤的起搏器叫什么

财务报表中的现金比率如何影响企业信用评级？

财务报表中的现金比率如何影响企业信用评级？

如何理解货币乘数的计算方式？这些方式如何影响货币政策？

如何理解货币乘数的计算方式？这些方式如何影响货币政策？

经常流鼻血，怕是白血病？90%的白血病孩子，都住过这样的家！

经常流鼻血，怕是白血病？90%的白血病孩子，都住过这样的家！

【考研数学】张宇1000题，汤家凤1800，李永乐660，应该怎么选择？

【考研数学】张宇1000题，汤家凤1800，李永乐660，应该怎么选择？

全民关注痛风日|喝什么对高尿酸/痛风有改善？

全民关注痛风日|喝什么对高尿酸/痛风有改善？

久停不爱车：汽车长时间停放的正确打开方式

久停不爱车：汽车长时间停放的正确打开方式

Kettle如何将Excel导入数据库

Kettle如何将Excel导入数据库

Kettle参数变量详解

Kettle参数变量详解

服务器CPU和普通CPU有什么区别？

服务器CPU和普通CPU有什么区别？

服务器CPU和普通CPU有什么区别？

服务器CPU和普通CPU有什么区别？

从新手到高手：马拉松服装选择的进阶之路

从新手到高手：马拉松服装选择的进阶之路

65岁后多做这件事，有助长寿！不仅是吃、动、睡……

65岁后多做这件事，有助长寿！不仅是吃、动、睡……

晚上腿疼睡不着怎么办？医生的专业解答来了

晚上腿疼睡不着怎么办？医生的专业解答来了

银行贷款逾期协商还款的法律依据

银行贷款逾期协商还款的法律依据

食管胃底静脉曲张套扎术后注意事项是什么

食管胃底静脉曲张套扎术后注意事项是什么

生活中隐藏的数学奥秘：你每天都在用的数学！

生活中隐藏的数学奥秘：你每天都在用的数学！

解除劳动合同后社保转移全攻略

解除劳动合同后社保转移全攻略

墙面反碱返潮起皮彻底解决方法

墙面反碱返潮起皮彻底解决方法

五首写尽物是人非、世事沧桑的古诗词，人事已改，草木依旧

五首写尽物是人非、世事沧桑的古诗词，人事已改，草木依旧

人工智能时代的创作者：掌握AI写作技巧，轻松驾驭各类文稿

人工智能时代的创作者：掌握AI写作技巧，轻松驾驭各类文稿

探索云南普洱茶：历史渊源、文化故事与传统工艺全解析

探索云南普洱茶：历史渊源、文化故事与传统工艺全解析

《罗素论幸福》：哲学家的幸福观

《罗素论幸福》：哲学家的幸福观

有哪些技巧可以快速训练狗狗

有哪些技巧可以快速训练狗狗

农村自建房是否合法？律师专业解答来了

农村自建房是否合法？律师专业解答来了

易经详解：第二十六卦大畜卦

易经详解：第二十六卦大畜卦

人防车位和产权车位有啥区别

人防车位和产权车位有啥区别

实事为民，人防工程新作为，停车便民解烦忧

实事为民，人防工程新作为，停车便民解烦忧

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号