清华LongWriter:突破 10,000 字生成的长上下文AI模型
创作时间:
作者:
@小白创作中心
清华LongWriter:突破 10,000 字生成的长上下文AI模型
引用
腾讯
1.
https://new.qq.com/rain/a/20240820A00KLC00?media_id=&openApp=false&suid=&web_channel=wap
在自然语言处理领域,长上下文语言模型(LLMs)一直是研究的热点。当前的长上下文大语言模型(LLMs)虽然能处理多达 10 万个标记的输入,但生成的输出却很难超过 2000 字这样一个不算长的长度。今天,我们要介绍的是由清华大学数据挖掘研究组(THUDM)开发的LongWriter项目,它能够生成超过 10,000 字的长文本内容!
什么是 LongWriter?
LongWriter 是一种专为处理长上下文而设计的语言模型。它的核心目标是解决传统语言模型在处理超长文本时遇到的挑战。通过优化模型架构和训练方法,LongWriter 能够在保持高质量输出的同时,生成超长文本。
LongWriter 目前有两个版本,分别为:LongWriter-glm4-9b 和 LongWriter-llama3.1-8b。此外,官方还在 agentwrite/ 目录下开源了 AgentWrite,这是一种自动化的超长输出数据的构建流程。
如何使用?
代码地址:
热门推荐
孩子被霸凌怎麼辦?心理師推教戰守則:先在家裡演練「這個」有助於變勇敢一點!
芦荟的花期是什么时候
右眼充血是怎么回事
高考志愿参考:材料科学与工程专业到底怎么样?值得报考吗?未来就业发展好不好?
“21世纪最佳书籍100本”书单发布,《我的天才女友》位列第一
如何制定一个高效的部门工作计划?【附完整指南】
有氧运动,一定要持续30分钟,才开始燃脂吗?
刀郎新歌《翩翩》歌词赏析:一首充满人生哲理的音乐作品
电子借条真的有法律效力?你必须知道的真相!
国家标准和行业标准的制定机构、流程及应用指南
冠心病常用药物全解析:从急救到长期管理
如何了解黄金的市场表现?这种了解的依据是什么?
一代是多少年,一代相当于多少年?揭秘世代周期长度
开学季又到 “学平险”该不该买?
【建筑设计】竹结构在现代建筑里的潜力
从 "失联" 到 "履约"!一起来看罚金执行背后的暖心故事
扶桑花的繁殖方法
表扬并鼓励猫咪!如何用“正向训练”让猫咪乖乖听话?
最新,2月LPR公布
小儿推拿“五大保健手法”,助力宝宝提高免疫力
授权委托书的委托人是谁:探究委托书的法律效力
如何选择合适房子的新风系统
柠檬酸钙的作用和功效
常见防火墙攻击和增强防火墙安全性措施
NBA最新排名:雄鹿位置不稳,湖人下滑至第5,掘金8连胜
缺硒的16个表现,你是否"中枪"了
机器学习算法分类及其在各行各业的应用
一文浅谈——汉字“族”字,3000多年演变史!
冬天,在加拿大可以做什么?
非法入侵计算机犯罪:法律适用与网络安全防护