清华LongWriter:突破 10,000 字生成的长上下文AI模型
创作时间:
作者:
@小白创作中心
清华LongWriter:突破 10,000 字生成的长上下文AI模型
引用
腾讯
1.
https://new.qq.com/rain/a/20240820A00KLC00?media_id=&openApp=false&suid=&web_channel=wap
在自然语言处理领域,长上下文语言模型(LLMs)一直是研究的热点。当前的长上下文大语言模型(LLMs)虽然能处理多达 10 万个标记的输入,但生成的输出却很难超过 2000 字这样一个不算长的长度。今天,我们要介绍的是由清华大学数据挖掘研究组(THUDM)开发的LongWriter项目,它能够生成超过 10,000 字的长文本内容!
什么是 LongWriter?
LongWriter 是一种专为处理长上下文而设计的语言模型。它的核心目标是解决传统语言模型在处理超长文本时遇到的挑战。通过优化模型架构和训练方法,LongWriter 能够在保持高质量输出的同时,生成超长文本。
LongWriter 目前有两个版本,分别为:LongWriter-glm4-9b 和 LongWriter-llama3.1-8b。此外,官方还在 agentwrite/ 目录下开源了 AgentWrite,这是一种自动化的超长输出数据的构建流程。
如何使用?
代码地址:
热门推荐
加班费在劳动合同中的约定与履行
在设计项目中,如何与客户进行有效的沟通和需求理解
黑海东头望大秦:亚欧佛教、宗教交流与合作
解锁心理学硕士的力量,懂人性才能赢未来!
PNAS: 持续而稳定的湿润气候促进秦-西汉王朝社会经济繁荣
美国胡佛大坝争议:生态保护与人类发展的平衡术
十大好吃的简易营养便当 10种最受欢迎盒饭做法
揭秘金融市场的神秘龟甲,海龟交易法则深度解析
叶酸与 5-甲基四氢叶酸的生物学特征与应用,活性叶酸选择指南
酸模的功效与种植方法:一种兼具观赏、食用和药用价值的植物
如何将视频从PC传输到iPhone:iTunes及其他多种方法详解
iPhone和电脑之间互传文件的三种方法
酒后晨起口臭 背后的“神秘力量”
刮痧的正确使用方法
刮痧注意事项:这些关键点你必须知道
如何准确计算股息股利收益?这些收益计算方法有哪些应用场景?
揭开能量秘密:营养成分表中的能量如何计算?
如何通过股票的技术指标筛选优质股
哪吒当红!数字文创产业如何撬动商业地产新增长?
“汇资源+建平台+优服务” 成都高新区打造国内领先数字文创产业高地
陈皮怎么吃
开心消消乐全关卡攻略:从入门到精通的完整指南
军工箱:坚不可摧的装备守护者
微软与OpenAI合作关系演变的启示
骆宾王七岁写出成名作,长大后的他怎么样了?
天玑9300和骁龙8gen3哪个好?巅峰对决!一文告诉你谁是性能之王
茯砖茶的正确冲泡方法,这几点很重要!
肺结核复发几率大吗?三个关键因素及预防措施
Ubuntu的源管理详解
自己做好吃的鸡爪吧