大模型可控文本生成技术最新综述
创作时间:
作者:
@小白创作中心
大模型可控文本生成技术最新综述
引用
CSDN
1.
https://blog.csdn.net/AIBigModel/article/details/141607710
本文全面概述了用于控制大型语言模型 (LLM) 中的文本生成的技术和方法,重点介绍了其理论基础和实际实现。文章从需求、定义、任务分类、方法分类等多个维度对可控文本生成技术进行了全面的阐述,并配以相关图表进行说明。
可控文本生成的需求
可控文本生成(CTG)必须满足两个主要要求:
- 满足预定义的控制条件:确保生成的文本符合指定的标准,例如主题一致性、安全性和风格一致性。
- 保持文本质量:确保生成的文本流畅、有用且多样化,同时平衡控制和整体质量。
与大语言模型中的可控生成相关的Web of Science上的出版趋势
大型语言模型(LLMs)的可控性维度和能力维度
可控文本生成的形式化定义
对CTG的定义如下:
- 与 LLM 能力的关系:CTG 是一个与 LLM 的客观知识能力正交的能力维度,侧重于如何呈现信息以满足特定需求,例如风格或情感。
- 控制条件的注入:可以使用文本语料库、图表或数据库等资源将控制条件集成到文本生成过程的各个阶段。
- CTG 的质量:高质量的 CTG 在遵守控制条件和保持生成文本的流畅性、连贯性和有用性之间取得平衡。
可控文本生成任务
对可控文本生成(CTG)的任务进行了分类,主要分为以下两个大类:
- 内容控制(Content Control):也称为语言学控制或硬控制,专注于生成文本的具体元素,如文本的结构和词汇。这种类型的控制要求模型根据预定义的规则精确生成文本内容。内容控制包括:
- 结构控制:包括特定格式(如诗歌、食谱等)、组织结构(如段落划分、标题使用、列表排列)和长度控制。
- 词汇控制:确保文本包含预定义的关键词集,以及避免使用可能有害或不适当的术语。
- 属性控制(Attribute Control):也称为语义控制或软控制,关注文本的抽象语言属性,如情感、风格和主题。这种类型的控制旨在确保生成的文本在更高层次上反映特定的语义特征。属性控制包括:
- 安全性控制:包括去除有害内容和遵守法律法规。
- 情感控制:确保文本表现出明确的情感倾向,如积极、消极或中性。
- 风格控制:包括通用风格(适应特定场合和行业的专业沟通风格)和个人风格(模仿特定写作风格或根据个人喜好生成个性化文本)。
- 主题控制:确保文本严格遵守指定的主题。
可控文本生成方法分类
可控文本生成(CTG)方法分类:
- 模型驱动方法:使用分类器、条件语言模型或直接从LLMs本身注入知识。
- 数据驱动方法:利用丰富的数据资源,如文本语料库、词典、图和数据库来注入知识。
可控文本生成(CTG)的方法主要分为两个阶段:训练阶段和推理阶段
训练阶段方法
- 重训练(Retraining):从头开始训练新模型或对现有模型架构进行根本性修改,以更好地适应特定的控制条件。这通常在现有预训练模型无法满足新要求时采用。
- 微调(Fine-Tuning):通过使用专门设计的小型数据集来调整预训练模型,使其更好地符合特定的控制属性,而无需从头开始训练模型。
- 强化学习(Reinforcement Learning):使用奖励信号来引导模型输出朝向特定的控制目标。通过迭代优化,模型学习使其输出与这些目标对齐。
推理阶段方法
- 提示工程(Prompt Engineering):在推理阶段,通过设计特定的输入提示来直接影响文本生成,而无需对模型参数进行广泛调整。
- 潜在空间操作(Latent Space Manipulation):通过调整模型隐藏层中的激活状态来控制生成的文本,允许在不改变模型权重的情况下精确控制文本生成过程。
- 解码时干预(Decoding-time Intervention):在解码过程中修改生成输出的概率分布或应用特定规则,以影响单词选择,确保输出与特定控制条件对齐。
具体方法示例
- 重训练:例如CTRL模型,通过在训练文本前添加控制代码来区分不同的控制条件。
- 微调:例如Adapter-Based Fine-Tuning和Data-Driven Fine-Tuning,使用辅助模型或特定数据集来调整模型输出。
- 强化学习:例如Automated Feedback和Human Feedback方法,使用自动评估指标或人类反馈来优化模型。
参考文献
- 原文标题:Controllable Text Generation for Large Language Models: A Survey
- 链接:https://arxiv.org/pdf/2408.12599
- GitHub项目:https://github.com/IAAR-Shanghai/CTGSurvey
热门推荐
十里洋场:百年商业区变身上海城市更新样本
十里洋场:中西合璧建筑群里的上海百年传奇
马上评|海南旅游高峰出岛如何不再难
工业时代英国的宠物革命:从奢侈品到家庭伴侣
白桦茸新书发布,揭秘“菌中之王”医学奇迹
20首经典的小雪节气诗词,每一首都值得细细品味
英短猫:性格温和易护理,适合各类家庭饲养
桦树茸:天然免疫增强剂的科学解读
鱼肉、红薯、白菜:高尿酸人群的低嘌呤饮食方案
控糖选燕麦,高蛋白选莜麦:一文读懂两种谷物
桦树茸:东北珍稀药用真菌的功效与价值
色彩搭配秘籍:让你的画作惊艳众人
A2驾驶证年检进入倒计时,逾期将被降级
美食博主教你完美瑞士卷:从基础到创新的完整攻略
牛油果油版瑞士卷:健康美味在家DIY
解析左下腹痛:原因、缓解与就医指南
游记-清明上河园
CK-MB水平变化助力急性心肌梗死及时诊断
4-6小时即现异常,CK-MB助力心梗早期诊断
2024年成人高考专升本考试大纲重大调整揭秘
怎样举报诈骗电话号码
长期饮用蒸馏水或致矿物质缺乏,医生建议饮用白开水
长期饮用蒸馏水或致矿物质缺乏,专家建议谨慎饮用
无毒防腐性能佳,桐油成现代装修环保之选
冬季装修用桐油:环保防潮,这样施工效果最好
坤心宁颗粒:更年期盗汗的克星?
震泽古镇:千年古建见证江南水乡繁华
禹迹桥下的千年传说:走进震泽古镇
*ST信通1月14日复牌迎生死劫,5.68亿资金占用问题悬而未决
尖椒炒干豆腐的创意做法,你get了吗?