资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

FuseLLM：一键融合多个AI大模型的创新技术

创作时间:

作者:

@小白创作中心

FuseLLM：一键融合多个AI大模型的创新技术

引用

CSDN

https://blog.csdn.net/DEVELOPERAA/article/details/139326627

随着AI技术的飞速发展，大语言模型如LLaMA和Mistral等已成为行业内的热门话题。然而，创建全新的大语言模型不仅成本高昂，而且可能导致新旧模型之间的能力冗余。为了解决这一问题，中山大学和腾讯AI Lab的研究者们带来了一个创新性的解决方案——FuseLLM。

FuseLLM：融合多个异构大模型的创新方案

FuseLLM的独特之处在于它能够“融合多个异构大模型”。这不同于传统的模型集成，后者在推理时需要同时运行多个大模型，也不同于权重合并，后者要求合并的模型具有相同结构。FuseLLM能够巧妙地提取不同大模型的知识和能力，然后通过轻量级的持续训练，将这些知识和能力融合到一个全新的大语言模型中。

实现上，FuseLLM先对齐不同LLM的标记化，再融合它们生成的概率分布。在持续训练过程中，FuseLLM着重减小目标LLM与源LLM之间的概率分布差异。这样，目标LLM就能逐渐吸收源LLM的知识和能力。

为了验证FuseLLM的有效性，研究者们在多个开源LLM上进行了实验，包括Llama-2、OpenLLaMA和MPT等。结果显示，在推理、常识和代码生成等42个任务中，FuseLLM训练的目标模型在大多数任务上都优于源LLM和基线模型。

此外，研究者们还模拟了具有相同架构但功能不同的LLM。通过在这些领域特定的语料库上持续训练单个基础模型，他们发现FuseLLM在结合这些结构相同的LLM的能力方面表现出色，优于传统的集成和权重合并方法。

Huggingface Models 上发布了 FuseLLM-7B ，它是三个流行的开源 LLMs 的融合，它们具有独特的架构和功能：Llama-2-7B、OpenLLaMA-7B 和 MPT-7B。

FuseLLM-7B 模型地址：https://huggingface.co/bartowski/FuseLLM-7B-exl2

热门推荐

怎样成为一名职业男模特

【枕芯材质】枕芯用什么填充物好？什么材质的枕芯最适合你？

人生进入迷茫阶段怎么办？五步帮你重获方向

近十年胰腺癌发病率逐年上升，“癌症之王”如何实现早筛早诊？

手机Excel表怎么冻结行和列

电视应用安装失败怎么办？80%的问题都能用这个方法解决

父母课堂 | 适合周末跟孩子一起做的10件小事

N95口罩佩戴多久换一次？专家权威解答来了

艾滋病毒能在水中存活吗？揭开关于“艾滋在水里”的迷雾

过继八字真的能续命吗？八字与命运的神秘联系

漳平水仙茶的正确泡法：从茶具到水温的全方位指南

决战平安京彼岸花出装攻略彼岸花属性介绍

两阳夹一阴在股市中意味着什么？

牛油果对人体有益吗？完全指南

西红柿炒鸡蛋的烹饪技巧：从食材到出锅的完美指南

下雨天会影响天安门升旗吗？答案令人敬佩

减体脂的最好锻炼方法体脂多少才能看到腹肌

持续耳闷耳鸣原来是耳咽管功能异常造成的！本篇告诉你五种药物及非药物治疗

探秘楚天民俗第一村：刘家桥村的独特魅力

饭后血压升高怎么办？专家解析原因及应对方法

春晚机器人扭秧歌的科技“秘籍”是什么？| 热点科普

超新星爆发会影响地球吗？

常见的复姓有哪些？

如何解决房间的除湿问题？这种解决如何提升居住舒适度？

认识声带与声音障碍

银川这家医院“上新”中药茶饮！医生提醒这样喝→