问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

破解AI能耗困局:液冷技术推动数据中心绿色升级

创作时间:
作者:
@小白创作中心

破解AI能耗困局:液冷技术推动数据中心绿色升级

引用
小熊财经itbear
12
来源
1.
http://m.finance.itbear.com.cn/html/2025-01/132819.html
2.
https://finance.sina.com.cn/stock/relnews/cn/2024-10-21/doc-inctiptv9146765.shtml
3.
https://finance.sina.com.cn/roll/2024-12-17/doc-inczukxm4753509.shtml
4.
https://c.m.163.com/news/a/JEIBEUTS051288FS.html?referFrom=
5.
https://m.sohu.com/a/818152737_122066725/?pvid=000115_3w_a
6.
https://www.showapi.com/news/article/678859bc4ddd79f11a4cd261
7.
https://www.escn.com.cn/20240319/48b161d2f86748a2b571943bf39ee4af/c.html
8.
https://www.vertiv.cn/zh-CN/about/news-and-insights/news-releases/vertiv-releases-aigc-full-stack-liquid-cooling-solution-to-unleash-ai-computing-power/
9.
https://www.ditan.com/news/hot/6310.html
10.
https://www.ciecc.com.cn/art/2024/9/12/art_3963_108029.html
11.
https://www.gigalight.com.cn/bbs/market-4070.html
12.
http://www.pdidc.com/n-r-industry-5716.html

随着人工智能(AI)技术的迅猛发展,其在各个领域的应用日益广泛,从自动驾驶到医疗诊断,从金融风控到智能制造,AI正以前所未有的速度改变着我们的生活和工作方式。然而,在这一波创新浪潮的背后,一个不容忽视的问题逐渐浮出水面——AI系统的能耗问题。

根据最新的研究报告,全球数据中心的电力消耗已经占据了全球总电力消耗的约1%,并且这一数字还在以每年10%的速度增长。AI模型的训练过程尤其耗能,例如,训练一个大型语言模型可能需要耗费数百万瓦时的电力,相当于一个普通家庭几年的用电量。这种高能耗不仅带来了巨大的经济成本,也对环境造成了不可忽视的影响。

具体来看,AI能耗主要集中在以下几个方面:

  • 硬件设备:高性能GPU、TPU等专用芯片虽然提升了计算能力,但同时也大幅增加了电力需求。据统计,一块顶级GPU在满负荷运行时的功耗可达300瓦以上。
  • 数据传输:大规模的数据集传输和处理需要大量的网络带宽和存储资源,这进一步加剧了能源消耗。据估算,仅数据传输环节就占到了整个AI系统能耗的20%-30%。
  • 模型训练:深度学习模型的训练过程通常需要反复迭代,每次迭代都会消耗大量计算资源。特别是对于那些参数量庞大的模型,如BERT、GPT系列,单次训练所需的时间和电力成本极高。

面对如此严峻的能耗挑战,业界已经开始积极寻求解决方案。一方面,通过技术创新来提高硬件效率,降低单位计算任务的能耗;另一方面,优化算法设计,减少不必要的计算开销,从而实现节能减排的目标。

液冷技术:突破AI能耗瓶颈的关键

在众多解决方案中,液冷技术因其卓越的散热效率和能源利用率,成为解决AI基础设施能源挑战的关键方案。液冷技术通过液体作为冷却介质,直接或间接接触发热源,将热量带走,相比传统的风冷技术具有显著优势。

液冷技术的优势

液冷技术具有四大显著优势:

  1. 低碳节能:液冷技术能显著降低供冷电力消耗,缩减运营费用,减少碳排放。据绿色云图运营总监徐明微介绍,应用液冷技术相比风冷可节能30%,减少30%的碳排放。
  2. 高密度部署:液冷技术能够大幅提升机柜部署密度,降低数据中心内部网络传输成本。
  3. 静音效果:液冷技术能达到“静音”机房的效果,大幅降低机房噪音。
  4. 设备可靠性:液冷技术能有效降低服务器的故障率,保证设备在高温环境下稳定运行。

市场趋势与应用现状

近年来,液冷技术在数据中心中的应用呈现快速增长态势。据统计,2023年上半年,中国液冷服务器市场中,冷板式占比达90%。然而,随着芯片功率的不断提升,冷板式液冷的散热能力逐渐接近极限,浸没式液冷的优势愈发凸显。

目前,液冷技术主要有两大技术路径:

  • 冷板式液冷:通过冷却液流经服务器主板上的散热器来带走热量,对数据中心与服务器架构的改造程度小、产业链成熟度高、部件更换运维便捷、初期投资较低等优势,市场占有率更高。
  • 浸没式液冷:将服务器完全浸泡在冷却液中,散热效率更高,但对冷却液的要求也更高。

在实际应用中,风液混合模式成为当前适宜的供冷方式。对于高功耗服务器采用液冷,低功耗设备则可保留风冷。

未来发展趋势与挑战

尽管液冷技术具有显著优势,但在实际应用部署上,兼顾成本与性能的最佳路径将是风液混合模式。对于功耗较大的服务器,采用液冷技术以提升机柜密度、降低碳排放;而对于功耗较小的存储设备、网络设备,则可采用传统风冷技术。风液混合模式已成为2025年数据中心应用的一种适宜供冷方式。

在冷却液方面,浸没式液冷主要有相变式和单相式两种流派。相变式液冷多采用氟化液作为冷却液,但氟化液具有一定的挥发性,对人体健康和环境产生危害。因此,很多液冷厂商对氟化液的应用前景并不看好,取而代之的则是合成油、合成脂类冷却液。英特尔发布的G-Flow浸没式液冷机柜就采用了埃克森美孚的无PFAS浸没式冷却液,既环保又降低成本。

浸没式液冷在2025年的主要优化方向将是新型冷却液的研发,研发出成本更低、更环保、导热性、流动性更好的冷却液,将进一步推动浸没式液冷的规模化应用。冷板式液冷的优化方向则是安全性的提升,如何确保不漏液并做好漏液后的防护措施是首要挑战。

液冷技术在不断演进的同时,生态和产业链的建设也将成为液冷能否在数据中心得以大规模应用的关键。产学研用的共同努力是推动液冷技术发展的重要路径。由山东省海洋科学研究院牵头,联合巴斯夫(中国)有限公司、绿色云图等多家产业上下游企业,共同组建了“生物可降解润滑剂联合实验室”,旨在研发新型的合成油、合成脂类冷却液。

浪潮信息等硬件厂商也在积极推动产业生态的建立和标准的制定。浪潮信息拥有500多项液冷技术领域核心专利,已参与制定与发布10余项相关设计技术标准,对液冷产业的快速发展及液冷技术的大规模普及建设具有重要的指导意义。绿色云图也积极参与各项液冷相关的团标、行标、国标的制定,旨在规范行业发展,推动液冷在数据中心的应用更普适。

展望:液冷技术引领AI基础设施的绿色未来

随着各方共同努力,液冷技术在数据中心中的应用将逐渐走向普适化发展,更多的企业和数据中心能够以更具性价比的价格,用上更好用的液冷解决方案。液冷技术不仅解决了AI基础设施的能源挑战,更为实现可持续计算提供了重要途径。在不久的将来,液冷技术有望成为数据中心的标配,为AI技术的持续发展提供坚实支撑。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号