清华LongWriter:突破 10,000 字生成的长上下文AI模型
创作时间:
作者:
@小白创作中心
清华LongWriter:突破 10,000 字生成的长上下文AI模型
引用
腾讯
1.
https://new.qq.com/rain/a/20240820A00KLC00?media_id=&openApp=false&suid=&web_channel=wap
在自然语言处理领域,长上下文语言模型(LLMs)一直是研究的热点。当前的长上下文大语言模型(LLMs)虽然能处理多达 10 万个标记的输入,但生成的输出却很难超过 2000 字这样一个不算长的长度。今天,我们要介绍的是由清华大学数据挖掘研究组(THUDM)开发的LongWriter项目,它能够生成超过 10,000 字的长文本内容!
什么是 LongWriter?
LongWriter 是一种专为处理长上下文而设计的语言模型。它的核心目标是解决传统语言模型在处理超长文本时遇到的挑战。通过优化模型架构和训练方法,LongWriter 能够在保持高质量输出的同时,生成超长文本。
LongWriter 目前有两个版本,分别为:LongWriter-glm4-9b 和 LongWriter-llama3.1-8b。此外,官方还在 agentwrite/ 目录下开源了 AgentWrite,这是一种自动化的超长输出数据的构建流程。
如何使用?
代码地址:
热门推荐
女人给你这4个“信号”,其实就是在委婉拒绝你,别再傻傻追了!
【法眼看剧】看《执行法官》如何准确理解“买卖不破租赁”?
2024年科学界新命名的十大类植物和真菌物种
实用口腔健康知识宝典:从儿童到成人,这些护牙要点请收好
痛愤!一位留学生在英国图书馆,发现大量中国失传的火药技术古籍
四个月宝宝可以吃什么辅食?科学添加,健康成长
揭秘月光族困境,为什么存不住钱?如何化解?
钢笔保养指南:让您的书写工具历久弥新
地球本身就是一个生命体?这个奇特假说,怀疑地球具有意识
钓鱼用什么鱼钩好?作钓的目标鱼不同,鱼钩的种类和型号也不同!
中亚三国边界为何犬牙交错?飞地问题的历史渊源
豆腐的多样做法与烹饪技巧,轻松打造美味健康菜肴
怎样理解不同投资工具的特点
PR转场特效添加与自然转场技巧详解
光纤猫常见亮灯情况详解:光信号正常灯位及故障排查指导
福建厦门旅游景点推荐,最值得打卡的27个厦门旅游景点!赶紧收藏
现货黄金市场趋势分析:宏观经济、地缘政治与美元的博弈
邓贵川《DSGE理论及应用实战-初中级》
指鹿为马:颠倒黑白的历史典故
《钢铁指挥官》:科幻战争宇宙里的即时战略自走棋
根因分析:如何从源头解决复杂问题
天津三日游攻略,探秘海河明珠,体验津味风情
《宝可梦大集结》胖可丁详细玩法指南 胖可丁技能搭配与持有物推荐
网剧《唐人街探案2》:颇具雄心,执行一般
室内设计装潢的五大神奇影响
学3d建模可以找什么工作?职业岗位一览
劳动合同订立案例分析:探究劳动关系的建立与维护
筷子中的中国传统文化:从形状到礼仪,从历史到传说
北向资金动态:对A股市场的影响分析
邢台市马路街小学:以体育为桥梁,家校共育助力健康成长