清华LongWriter:突破 10,000 字生成的长上下文AI模型
创作时间:
作者:
@小白创作中心
清华LongWriter:突破 10,000 字生成的长上下文AI模型
引用
腾讯
1.
https://new.qq.com/rain/a/20240820A00KLC00?media_id=&openApp=false&suid=&web_channel=wap
在自然语言处理领域,长上下文语言模型(LLMs)一直是研究的热点。当前的长上下文大语言模型(LLMs)虽然能处理多达 10 万个标记的输入,但生成的输出却很难超过 2000 字这样一个不算长的长度。今天,我们要介绍的是由清华大学数据挖掘研究组(THUDM)开发的LongWriter项目,它能够生成超过 10,000 字的长文本内容!
什么是 LongWriter?
LongWriter 是一种专为处理长上下文而设计的语言模型。它的核心目标是解决传统语言模型在处理超长文本时遇到的挑战。通过优化模型架构和训练方法,LongWriter 能够在保持高质量输出的同时,生成超长文本。
LongWriter 目前有两个版本,分别为:LongWriter-glm4-9b 和 LongWriter-llama3.1-8b。此外,官方还在 agentwrite/ 目录下开源了 AgentWrite,这是一种自动化的超长输出数据的构建流程。
如何使用?
代码地址:
热门推荐
香辣鸡翅火了!从零基础到大师级的做法全在这儿
鸡翅新吃法大比拼:香烤vs红烧,谁更胜一筹?
肖战版《射雕英雄传:侠之大者》:争议中的创新与传承
肖战版《射雕》遭遇口碑危机:网络批评与主流力挺的两极分化
野鸟太多导致农作物减产等损失,上海崇明“人鸟之争”有何解
证券市场高开高走秘籍大揭秘!
AI绘画与创作工具:数字艺术的新纪元
保定陆军军官学校的风云人物揭秘
保定陆军军官学校的建筑特色与保护现状
保定陆军军官学校:民国风云人物摇篮
油爆虾烹饪宝典:掌握复炸技巧,让虾壳酥脆、虾肉鲜嫩
你今天洗头了吗?为什么每天洗头还是很油腻?
《原神》动效设计揭秘:从技术到艺术的蜕变之旅
用Maya打造炫酷动画效果
播了一半就收官?古装剧《金庸武侠世界》“断崖式”停播,网友吵翻
从26亿《封神》到1亿《异人》,选角能定漫改影视生死?
《射雕英雄传》不同版本的黄蓉,个个貌美如花,哪个让你印象最深
离谱!直播间花499元抢的居然是假黄金?
揭秘假黄金骗局:合金、低纯度黄金被包装成足金售卖
酱香、浓香等各种种类的酒,它们的存放时间究竟有多久?
白酒开封后有保质期吗?该如何存放?
互联网彩票:市场扩张与监管挑战并存
彩票投资风险如何有效管理?
年轻人买彩票背后的多巴胺陷阱
广州三大历史遗迹:越秀公园、镇海楼、中山纪念堂
云溪植物园:广州新晋打卡圣地!
冬日徒步玉龙雪山,打卡文海花海
玉龙雪山:美景当前,安全意识更要“高耸入云”
玉龙雪山:圣洁的雪山女神,等你来征服!
洛阳美食名片:千年水席与百年牛汤