大语言模型面临的十大科学挑战
大语言模型面临的十大科学挑战
尽管这篇文章原始发布于2023年,但其讨论的主题——大语言模型面临的科学挑战,在当前仍然具有重要的参考价值。
在人工智能领域,大模型已经成为当下技术发展的一个重要趋势。大模型通常是指,参数数量超过千万甚至上亿级别的深度学习模型,这些模型通过对海量数据的训练,能够拥有强大的预测和生成能力,被广泛应用于如自然语言处理、图像识别、语音合成等方面。其中,语言模型是大模型的一个重要分支,它通过对人类语言数据的训练,能够理解和生成自然语言文本。大模型的核心能力在于其能够通过预测下一个词的概率来生成文本。
大语言模型存在的不足
无法实时获取最新信息:大语言模型需要训练大量的文本数据,而这些数据往往都是过去的语料库,无法实时获取最新的信息。
无法进行多步推理和反向推理:目前的语言模型仍然无法进行多步推理,这意味着它们无法根据一系列前提或条件推理得出结论。
无法进行长运算:由于大语言模型是基于概率进行预测的,因此,它们给出的答案并不一定百分百准确,较长的运算容易出错。
无法处理复杂计算和逻辑推理:大语言模型并没有接受过数学运算、逻辑推理等任务的训练,对于一些复杂的计算和逻辑推理任务往往无法胜任。
无法承载较长的输入:如果将近千页的文档利用大语言模型进行分析,是没有办法得出结果的。
大语言模型面临的科学挑战
模型架构:现在大模型的基础架构非常复杂,这限制了模型规模的进一步扩大。
思维链:大模型的多步推理仍然较弱,无法将一个复杂问题拆分成几个简单问题,目前的人工智能无法生成思维链。
数据的训练:现在的大语言模型是多阶段训练和测试的,无法根据其在训练集上的表现推测出它在测试集上的表现。
幻觉问题:生成式模型会生成一些现实世界不存在的,或者和事实相违背的结果。
多模态扩展:当前的语言模型还不能接受语言以外的其他模态信息,如音频、视频、图像等。
持续学习:当人类产生的知识和数据来源不足以支撑模型训练时,该如何继续提高模型呢?
实时学习:人工智能在与人交互的时候,是否能通过与人类的交互反馈去学习。
智能代理:如何将“对话式”的大模型转变成类智能体,增加其使用工具的能力和规划能力,也是一个重要方面。
自动化评价:现在还没有找到一个客观指标评价人工智能的能力,反映人类对此的真实感受。
大模型的大众化:大模型的算力成本非常高,如何让大众在消费级显卡上使用大模型也变得非常重要。
对策与建议
从目前来看,我们还不能完全解决上述这些问题,但是不妨碍以后通过工程技术的发展来解决。例如,可以通过接入搜索引擎来解决无法实时获取最新信息的问题,让其学会使用各种各样的插件,学会使用搜索引擎。此外,还有一个非常重要的问题,即如何让大模型对齐人类的价值观,这就需要人类对其进行“点赞”,对其回答质量进行打分,识别哪些是更安全、更无害的社会行为规范。通过训练某个模型,让模型不停地迭代,然后给出更好的答案。在训练模型的过程中,需要遵循三个基本原则:有用性、诚实性和无害性,通过对齐人类的价值观使得这个模型更加安全。
本文原文来自《新经济导刊》2023年第9-10期合刊