大模型可控文本生成技术最新综述
创作时间:
作者:
@小白创作中心
大模型可控文本生成技术最新综述
引用
CSDN
1.
https://blog.csdn.net/AIBigModel/article/details/141607710
本文全面概述了用于控制大型语言模型 (LLM) 中的文本生成的技术和方法,重点介绍了其理论基础和实际实现。文章从需求、定义、任务分类、方法分类等多个维度对可控文本生成技术进行了全面的阐述,并配以相关图表进行说明。
可控文本生成的需求
可控文本生成(CTG)必须满足两个主要要求:
- 满足预定义的控制条件:确保生成的文本符合指定的标准,例如主题一致性、安全性和风格一致性。
- 保持文本质量:确保生成的文本流畅、有用且多样化,同时平衡控制和整体质量。
与大语言模型中的可控生成相关的Web of Science上的出版趋势
大型语言模型(LLMs)的可控性维度和能力维度
可控文本生成的形式化定义
对CTG的定义如下:
- 与 LLM 能力的关系:CTG 是一个与 LLM 的客观知识能力正交的能力维度,侧重于如何呈现信息以满足特定需求,例如风格或情感。
- 控制条件的注入:可以使用文本语料库、图表或数据库等资源将控制条件集成到文本生成过程的各个阶段。
- CTG 的质量:高质量的 CTG 在遵守控制条件和保持生成文本的流畅性、连贯性和有用性之间取得平衡。
可控文本生成任务
对可控文本生成(CTG)的任务进行了分类,主要分为以下两个大类:
- 内容控制(Content Control):也称为语言学控制或硬控制,专注于生成文本的具体元素,如文本的结构和词汇。这种类型的控制要求模型根据预定义的规则精确生成文本内容。内容控制包括:
- 结构控制:包括特定格式(如诗歌、食谱等)、组织结构(如段落划分、标题使用、列表排列)和长度控制。
- 词汇控制:确保文本包含预定义的关键词集,以及避免使用可能有害或不适当的术语。
- 属性控制(Attribute Control):也称为语义控制或软控制,关注文本的抽象语言属性,如情感、风格和主题。这种类型的控制旨在确保生成的文本在更高层次上反映特定的语义特征。属性控制包括:
- 安全性控制:包括去除有害内容和遵守法律法规。
- 情感控制:确保文本表现出明确的情感倾向,如积极、消极或中性。
- 风格控制:包括通用风格(适应特定场合和行业的专业沟通风格)和个人风格(模仿特定写作风格或根据个人喜好生成个性化文本)。
- 主题控制:确保文本严格遵守指定的主题。
可控文本生成方法分类
可控文本生成(CTG)方法分类:
- 模型驱动方法:使用分类器、条件语言模型或直接从LLMs本身注入知识。
- 数据驱动方法:利用丰富的数据资源,如文本语料库、词典、图和数据库来注入知识。
可控文本生成(CTG)的方法主要分为两个阶段:训练阶段和推理阶段
训练阶段方法
- 重训练(Retraining):从头开始训练新模型或对现有模型架构进行根本性修改,以更好地适应特定的控制条件。这通常在现有预训练模型无法满足新要求时采用。
- 微调(Fine-Tuning):通过使用专门设计的小型数据集来调整预训练模型,使其更好地符合特定的控制属性,而无需从头开始训练模型。
- 强化学习(Reinforcement Learning):使用奖励信号来引导模型输出朝向特定的控制目标。通过迭代优化,模型学习使其输出与这些目标对齐。
推理阶段方法
- 提示工程(Prompt Engineering):在推理阶段,通过设计特定的输入提示来直接影响文本生成,而无需对模型参数进行广泛调整。
- 潜在空间操作(Latent Space Manipulation):通过调整模型隐藏层中的激活状态来控制生成的文本,允许在不改变模型权重的情况下精确控制文本生成过程。
- 解码时干预(Decoding-time Intervention):在解码过程中修改生成输出的概率分布或应用特定规则,以影响单词选择,确保输出与特定控制条件对齐。
具体方法示例
- 重训练:例如CTRL模型,通过在训练文本前添加控制代码来区分不同的控制条件。
- 微调:例如Adapter-Based Fine-Tuning和Data-Driven Fine-Tuning,使用辅助模型或特定数据集来调整模型输出。
- 强化学习:例如Automated Feedback和Human Feedback方法,使用自动评估指标或人类反馈来优化模型。
参考文献
- 原文标题:Controllable Text Generation for Large Language Models: A Survey
- 链接:https://arxiv.org/pdf/2408.12599
- GitHub项目:https://github.com/IAAR-Shanghai/CTGSurvey
热门推荐
林钰珊:一位00后自媒体创作者的成功密码
易烊千玺与林钰珊:《小小的我》里的温情与突破
顺义区妇联亲子互动活动暖心上线
古代讼师的社会定位与社会效果
讼师在古代的社会定位是怎样的?朝廷为什么压制讼师?
律师VS讼师:在清末的司法改革中,讼师群体如何走向消亡?
徒步旅行运动有什么好处
每天户外活动有助于维持身体健康?户外运动和室内运动有何不同?
第五人格高端局进阶技巧玩法攻略 高端局六大玩法技巧分享
十二星座11月恋爱运势揭秘:谁最旺?
冬日打卡长春净月潭,天然氧吧等你来吸氧
长春四大必打卡景点揭秘
长春十大景点的独特魅力:与南方城市的差异对比
冬游长春必打卡:净月潭、伪满皇宫和冰雪新天地
蒋介石故居:中西合璧的建筑瑰宝
北伐胜利后的两种选择:蒋介石的“削藩”与白崇禧的“实边”
背部多汗是什么原因引起的
爱出汗的人,一定要喝这碗汤,气补足了,汗就少了
【中国公民健康素养66条(2024年版)(40)】讲究个人卫生应该怎么做?
贵州省消防接警培训:401名调度员实战能力全面提升
119接警流程揭秘:消防部队如何守护城市安全?
拨打119的正确姿势,你知道吗?
爆炒猪肝如何掌握火候,保持鲜嫩?
变与不变:哲学思辨中的永恒命题
大数据助攻“宝贝回家”,让寻亲不再遥不可及
儿童摄影秘籍:抓住萌娃最美瞬间
人脸识别助力团圆梦:从“梅姨案”看科技向善的力量
苏轼教你如何在变化中保持不变
赫拉克利特教你如何在变化中找到不变的自己
7种很可爱的垂盆多肉植物,春暖后就可以入手,适合新手