清华LongWriter:突破 10,000 字生成的长上下文AI模型
创作时间:
作者:
@小白创作中心
清华LongWriter:突破 10,000 字生成的长上下文AI模型
引用
腾讯
1.
https://new.qq.com/rain/a/20240820A00KLC00?media_id=&openApp=false&suid=&web_channel=wap
在自然语言处理领域,长上下文语言模型(LLMs)一直是研究的热点。当前的长上下文大语言模型(LLMs)虽然能处理多达 10 万个标记的输入,但生成的输出却很难超过 2000 字这样一个不算长的长度。今天,我们要介绍的是由清华大学数据挖掘研究组(THUDM)开发的LongWriter项目,它能够生成超过 10,000 字的长文本内容!
什么是 LongWriter?
LongWriter 是一种专为处理长上下文而设计的语言模型。它的核心目标是解决传统语言模型在处理超长文本时遇到的挑战。通过优化模型架构和训练方法,LongWriter 能够在保持高质量输出的同时,生成超长文本。
LongWriter 目前有两个版本,分别为:LongWriter-glm4-9b 和 LongWriter-llama3.1-8b。此外,官方还在 agentwrite/ 目录下开源了 AgentWrite,这是一种自动化的超长输出数据的构建流程。
如何使用?
代码地址:
热门推荐
Nature:克拉屈滨或可用于晚期肝癌的治疗?
乙肝丙肝会最终转变为肝癌吗
从厨房小白到牛蛙烹饪大师:超详尽红烧牛蛙做法全解析
家庭采暖系统——地暖采暖系统详解
如何在NAS组网中实现文件的自动同步
猫感染狂犬病毒后的发作时间及症状
如何在企业中有效运用目标管理五要素提升绩效?
揭秘古代火折子:竹筒里的智慧如何让火苗随心所欲?
引资入股股权分配的案例分析:通过实际案例分析引资入股股权分配的具体情况和经验教训
《暗黑破坏神4》主线完整剧情全流程详解
金红石型TiO₂上草酸和硝酸共还原电合成甘氨酸
AI绘画如何描述纳西妲
等离激元纳米结构中的热电子动力学
千年古建话消防,云游西溪二仙庙!
长江云调查 | 骑行限速10km/h,东湖绿道“慢”下来了吗?
泉州青年学子助力“非遗”传承,赋能文旅融合
跑步防止膝盖疼的方法
重新认识一下吧,五湖~
代表委员热议:如何强化教育对科技和人才的支撑作用?
上甘岭血流成河,王近山总结:如用12军战术,起码少牺牲三千人
上甘岭战役——世界上最长的43天
揭秘AP卡莎:英雄联盟手游中的全能输出王者,符文搭配决定胜负
四渡赤水 完美制胜——纪念四渡赤水战役胜利90周年
给宝宝测体温的正确方法
天狼星附近,生命存在的可能性究竟有多大?
域名服务器的种类包括什么?
蛇年说蛇② | 灵蛇衔珠,雄黄避蛇,江苏历代典籍里的“蛇故事”
可摘局部义齿与固定义齿:优缺点对比及选择建议
植筋胶加固技术:施工条件全解析
“一张图”解码上海之巅最佳观赏时刻