清华LongWriter:突破 10,000 字生成的长上下文AI模型
创作时间:
作者:
@小白创作中心
清华LongWriter:突破 10,000 字生成的长上下文AI模型
引用
腾讯
1.
https://new.qq.com/rain/a/20240820A00KLC00?media_id=&openApp=false&suid=&web_channel=wap
在自然语言处理领域,长上下文语言模型(LLMs)一直是研究的热点。当前的长上下文大语言模型(LLMs)虽然能处理多达 10 万个标记的输入,但生成的输出却很难超过 2000 字这样一个不算长的长度。今天,我们要介绍的是由清华大学数据挖掘研究组(THUDM)开发的LongWriter项目,它能够生成超过 10,000 字的长文本内容!
什么是 LongWriter?
LongWriter 是一种专为处理长上下文而设计的语言模型。它的核心目标是解决传统语言模型在处理超长文本时遇到的挑战。通过优化模型架构和训练方法,LongWriter 能够在保持高质量输出的同时,生成超长文本。
LongWriter 目前有两个版本,分别为:LongWriter-glm4-9b 和 LongWriter-llama3.1-8b。此外,官方还在 agentwrite/ 目录下开源了 AgentWrite,这是一种自动化的超长输出数据的构建流程。
如何使用?
代码地址:
热门推荐
明朝藩王的兵权问题:历史考察与分析
一般人格权和具体人格权的区别是什么?
下颚线长痘是否为内分泌失调的表现
三国关羽军职变迁及其法律意义
围攻9价,国产HPV疫苗大变革
北太天元科普: 数值计算、符号计算与逻辑推理证明
买房不迁户口能上学吗?详解户籍与学区政策
“天鹅之城”最佳观赏时间表
当机器模仿而不是创造时:为什么 AI “艺术”不是真正的艺术
AI绘画与人类临摹的区别
小孩发烧时家长应如何正确应对与护理的指南
全球十大恶性杂草:这些野草已在我国多地泛滥成灾,及时清除刻不容缓
四川三星堆遗址的具体位置及历史价值解析
秦国统一六国的顺序是什么?详细分析六国统一过程
从目标到行动:新年任务分解的实用技巧
太阳为什么能一直燃烧
铁路数字化转型对乘客体验有哪些提升?
信息素:动物与人类交流中不可忽视的化学信号与影响
选购洗碗机必知的7大注意事项:容量、清洗、烘干、消毒、智能、品牌、禁忌
家庭园艺种植类型和常用花卉和香草品种选择
聊聊ElasticSearch中的向量检索
新手必知:如何进行样本量计算?
EPA鱼油是什么?EPA的4大功效助你抗炎、降脂、稳定情绪!
艾灸除湿气最快的方法是什么
最简单的醒酒解酒方法 解酒的最快方法几个小妙招
尾盘买入涨停板股票的判断依据
揭秘 CPU 跑分天梯图:性能比较与选购指南详解
服务器上的SSD和RAID如何使用
机器人大热,新时达接班人"临阵脱逃"
杉杉股份“危机四伏”:业绩骤变转亏,控股股东被申请重整!遗孀“上位”挑战多