使用AI大模型的正确姿势:五种优化方法详解
使用AI大模型的正确姿势:五种优化方法详解
随着AI大模型的广泛应用,如何优化和增强其能力成为了一个重要的课题。本文将介绍五种常用的方法:优化提示词、使用外部知识库(RAG)、微调、更换大模型、使用多模态大模型。通过具体案例和工作流程图,详细解释每种方法的原理和应用场景。
1. 优化提示词
当大模型的输出内容不满足你的期望时,你可以选择优化提示词,直到优化到不能优化。使用提示词生成答案(图来源:myscale)
RAG工作流程(图来源:Monigatti)
RAG让模型具备特定领域的知识,从而表现得更好。外部知识库可以是公司产品说明、教程或用户指南;客服回答的问题、聊天记录;公司政策文件、标准操作程序;你写过的文章等等。使用何种外部知识库,取决于你的目标。
使用外部知识库,最直接的方式是在AI机器人聊天页面上传文档,开启对话。比如下图是我使用kimi解读一篇论文。(官网:kimi.moonshot.cn)。你也可以尝试扣子(官网:coze.cn)
上传某本书/文章 让kimi解读
但是这种做法也有局限。如果你不想文档泄漏,或者公司里面有成千上万个文档,你就需要借助新的工具或者运用,甚至开发专用的运用。
下图是一些常用的RAG工具,这些工具在Github上Star较多。
常见RAG工具/运用(整理:mscreate)
案例:某科技公司将RAG应用于其客户支持系统,大模型通过检索公司内部的技术文档和历史支持记录,能够在几秒钟内为客户提供精准的解决方案,大大提高了客户满意度和支持效率。
3. 微调大模型
微调是指在预训练大模型的基础上,进一步在较小的、特定领域的数据集上进行训练。
微调示意(图来源:myscale)
微调有助于让大模型更满足特定需求。例如,你想让大模型翻译地方方言更准确,那可以使用地方方言数据集微调大模型。
与RAG不同,RAG是使用外部信息增强模型的知识,而微调则是更新模型的参数,使其更好地适应你的领域或任务。当你拥有某个领域特定的数据时,微调特别有用。
案例:如果你想构建一个法律大模型,可以用法律文件、法律案例和合同等数据微调模型。使其在法律文件分析和合同审查中表现出色,能够快速识别潜在风险和异常条款,帮助律师更高效地完成工作。
4. 换一个大模型
除了上面的方法外,你还可以换一个模型,并非一定要拘泥于使用一个模型。模型和模型之间能力有所差别。有些模型更擅长写出流畅的中文,有的则更擅长数据分析或者长文本处理、写代码。成本也有所差别。当然还有其他差别。
5. 使用多模态大模型
模型不仅仅只能处理文本,还可以处理图像、音频、视频等。多模态大模型可以同时处理文本、图像等。很多应用场景需要多模态技术支持才能实现。比如,借助多模态技术,让视力受损的人能轻松浏览网络,甚至在真实世界中充当导航。
GPT-4V展示的多模态使用例子
假设你在开发一个内容创作平台,帮助博主和营销人员制作引人入胜的文章。有了多模态大模型,用户输入提示词,AI会生成一篇精美、用吸引力的文章,还会附带相关的图片。目前多模态大模型正在快速发展中。