问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

LONGWRITER：突破大语言模型10,000+字长文本生成的技术方案

创作时间:

作者:

@小白创作中心

LONGWRITER：突破大语言模型10,000+字长文本生成的技术方案

引用

CSDN

1.

https://blog.csdn.net/m0_75077001/article/details/141270873

当前的大语言模型虽然能够处理超过100,000个token的输入，但在生成输出时却难以突破2000个token的限制。为了解决这一问题，研究者提出了LONGWRITER方案，通过Agent Write方法、Long Writer-6k数据集以及Longbench-Write基准测试，成功实现了生成超过10,000字的长文本输出。

Agent Write：受人类写作启发的长文本生成方案

Agent Write方法受到人类作家写作过程的启发，通常作家在面对长时间的写作任务时，会先制定一个详细的写作计划，包括每个章节的结构和目标字数。这种方法同样适用于大语言模型的长文本生成。

Agent Write主要包括三个步骤：

计划：模型根据用户输入生成详细的写作计划，包括每个段落的结构和目标字数。
写：在生成文本时，将前n-1段的内容作为输入，采用串行方式生成每段内容。
检验：通过LongWrite-Ruler检测模型的最长输出能力，并通过Longbench-Writer评估生成内容与用户指令的一致性。

Longbench-Write：评估长文本生成能力的基准测试

为了全面评估模型的长文本生成能力，研究者构建了Longbench-Write基准测试集。该测试集包含120个用户写作提示，其中60个中文，60个英文，每个提示都明确规定了字数要求，分为四个子集：

0-500字
500-2000字
2000-4000字
超过4000字

此外，测试集中的文本被分为七种类型：

文学和创意写作
学术和专著
大众科学
功能写作
新闻报道
社区论坛
教育和培训

评估方法

评估主要从两个维度进行：

文章长度达标情况
文章质量

文章质量的评估采用GPT-4o模型，从以下方面进行打分：

相关性
准确性
一致性
清晰度
广度和深度
阅读体验

最终取平均分作为文章的质量评分。

LongWriter数据集及模型训练

为了进一步提升模型的长文本生成能力，研究者构建了Long Writer-6k数据集，并基于此数据集对模型进行训练。

数据集构建

数据集构建过程如下：

从GPT-4o的SFT中选取3000条中文指令
从WildChat-1M中选取3000条英文指令
过滤掉有毒指令和无关内容
最终构建了输出长度在2k至10k之间的LongWriter-6k数据集

模型训练

研究者基于GLM-4-9B和Llama-3.1-8B两个开源模型进行微调，得到LongWriter-8B和LongWriter-9B。为了进一步提高模型质量，还对LongWriter-9B进行了偏好优化（DPO）：

DPO数据来自GLM-4聊天数据（约5万个样本）
额外构建了4000对针对长篇写作的数据
通过对比采样生成正负样本进行优化

实验结果表明，经过DPO优化后，模型性能提升了3%到4%。

热门推荐

闰年遇上二十四节气：从“无春年”说起

闰年遇上二十四节气：从“无春年”说起

2024又逢闰年：从凯撒到格列高利，揭秘闰年的前世今生

2024又逢闰年：从凯撒到格列高利，揭秘闰年的前世今生

朱利叶斯·凯撒和教皇格里高利十三世的闰年传奇

朱利叶斯·凯撒和教皇格里高利十三世的闰年传奇

猫咪不肯吃猫粮？赶紧来试试以下这些办法吧！

猫咪不肯吃猫粮？赶紧来试试以下这些办法吧！

小猫咪基本喂养指南

小猫咪基本喂养指南

李传波启功体书法解读《七律·和柳亚子先生》

李传波启功体书法解读《七律·和柳亚子先生》

毛泽东与柳亚子：一段跨越半个世纪的文人友谊

毛泽东与柳亚子：一段跨越半个世纪的文人友谊

毛泽东与柳亚子的诗词情缘：一首诗见证的家国情怀

毛泽东与柳亚子的诗词情缘：一首诗见证的家国情怀

口腔护理小窍门，告别口角炎烦恼

口腔护理小窍门，告别口角炎烦恼

如何选择优质的家居建材？这类建材在环保方面有哪些标准？

如何选择优质的家居建材？这类建材在环保方面有哪些标准？

乌俄冲突中，最常见的9种AK系列突击步枪

乌俄冲突中，最常见的9种AK系列突击步枪

俄罗斯AKM突击步枪：AK-47的升级改进型

俄罗斯AKM突击步枪：AK-47的升级改进型

你这一生的“命运”，无论好坏，都与家族的前三代人息息相关

你这一生的“命运”，无论好坏，都与家族的前三代人息息相关

猫的八大生活习性：从孤独到好奇

猫的八大生活习性：从孤独到好奇

黄昏时刻，如何拍摄出唯美的夕阳照片

黄昏时刻，如何拍摄出唯美的夕阳照片

职工退休后还要交补充医疗保险

职工退休后还要交补充医疗保险

自然风景描写技巧，让你的文字栩栩如生！

自然风景描写技巧，让你的文字栩栩如生！

三国大战中的关键人物：孙策、周瑜、曹操

三国大战中的关键人物：孙策、周瑜、曹操

三国三大战役：官渡、赤壁、夷陵，以弱胜强的军事智慧

三国三大战役：官渡、赤壁、夷陵，以弱胜强的军事智慧

香蒲，又称鬼蜡烛、水蜡烛，有4大作用，价值极高，农民要了解！

香蒲，又称鬼蜡烛、水蜡烛，有4大作用，价值极高，农民要了解！

猫眼前端如何吸光

猫眼前端如何吸光

非洲象在河边喝水，被鳄鱼一口咬掉象鼻，大象没了鼻子还能活吗？

非洲象在河边喝水，被鳄鱼一口咬掉象鼻，大象没了鼻子还能活吗？

由黄河铁路桥看中国铁路之变

由黄河铁路桥看中国铁路之变

兰州中山桥：跨越黄河的钢铁传奇，百年历史见证

兰州中山桥：跨越黄河的钢铁传奇，百年历史见证

两德统一背后的德国全称变迁史

两德统一背后的德国全称变迁史

爱因斯坦的光电效应：从偶然发现到诺贝尔奖

爱因斯坦的光电效应：从偶然发现到诺贝尔奖

MIT & Technion联手揭秘光子与物质新奥秘

MIT & Technion联手揭秘光子与物质新奥秘

烧牛腩烹饪全攻略：从食材到火候的完美演绎

烧牛腩烹饪全攻略：从食材到火候的完美演绎

岭南情怀：曲艺与现代艺术的融合之路传承与创新的曲艺粤剧文化交流会在荔湾举行

岭南情怀：曲艺与现代艺术的融合之路传承与创新的曲艺粤剧文化交流会在荔湾举行

2025年1月起，退休人员医保划入金额调整，能有400元吗？

2025年1月起，退休人员医保划入金额调整，能有400元吗？

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号