了解生成式 AI 的技术生态系统

创作时间:

作者:

@小白创作中心

了解生成式 AI 的技术生态系统

引用

来源

https://trailhead.salesforce.com/zh-CN/content/learn/modules/generative-ai-basics/understand-the-technology-ecosystem-of-generative-ai#supercharging-generative-ai-training

生成式AI正在以惊人的速度发展，其背后的技术生态系统也在不断完善。本文将为您详细介绍生成式AI的关键技术要素、技术堆栈以及企业应用中常见的疑虑。

学习目标

完成本单元后，您将能够：

识别有助于生成式AI快速发展的关键要素。
描述构成生成式AI技术堆栈的技术类型。
描述企业对生成式AI的常见疑虑。

增强生成式AI训练

生成式AI能在短时间内掌握很多技能，这种令人难以置信的进步速度主要归因于三个重要因素。首先是大量训练数据的可获性。如前一单元所述，互联网上10亿多的网页是写作的重要来源。但只有当您找到数据的使用方法时，数据才有用。这就是第二个重要因素：更好的训练。

正如您在人工智能基础知识中所学到的，研究人员设计的神经网络使用复杂的数学函数来训练AI模型。神经网络架构是一个不断发展的研究领域。2017年，谷歌研究人员发表了一篇关于训练大语言模型的颠覆性论文。他们提出了一种名为Transformer的新型AI架构。正如您所能想到的，这项研究的细节相当复杂。但为了（极大地）简化，该新架构能够识别单词之间的重要关系，无论它们在文本块中相距多远。即使在处理了大量单词之后，它也可以记住这一关系。

新型Transformer架构让我们意识到了生成式AI快速发展的第三个主要因素：计算能力。AI模型训练时需要通过强大的处理能力来执行数学运算。从历史上看，AI模型被设计成需要按顺序执行一系列计算。而Transformer架构则不同，它依赖于许多独立的并行计算。

因此，在一个计算机处理器执行第一个计算时，另一个处理器同时执行第二个计算。这被称为并行计算，并大大缩短了训练Transformer所需的时间。除此之外，近年来能够进行并行计算的处理器变得更加强大，种类也愈加丰富。

数据、架构和计算这三个因素已经融合在一起，为训练出能力极其强大的大语言模型创造了恰到好处的条件。其中最大的语言模型之一是GPT语言模型，它代表创成式预训练Transformer。换而言之，这是一个经过训练可以用来生成文本相关内容的模型。

新兴生态系统

现在，互联网上已经有数百个网站可以让您亲身体验生成式AI。当您访问其中一个网站时，实际上只是接触到了技术冰山的顶层。而这项技术有很多不同的来源。让我们来探索一下为大家带来令人惊叹的生成式AI体验所需的技术堆栈。

让我们在冰山的底层从计算硬件提供商开始。训练LLM需要大量的计算能力，即使训练的是Transformer。在完成对一个模型的训练后，在该模型的实际使用过程中处理各种请求也需要计算能力。从技术角度而言，您可以在任何计算硬件上训练AI模型，但擅长并行计算的处理器是理想选择。如今，在AI计算领域最知名的品牌是英伟达(Nvidia)。
接下来是云平台，使开发人员能够利用云部署模型中的计算硬件。开发人员可以为特定项目租用适当的计算时间，而这些平台可以在一个互联系统中高效地分配计算时间请求。谷歌、亚马逊、微软和甲骨文是该领域的主要技术提供商。
包括LLM在内的AI模型是下一层。这些模型是借助研究技术精心打造的，并使用公共和私人提供的数据进行训练。开发人员可以通过应用程序编程接口(API)连接到LLM，以便在自己的应用程序中充分利用NLP的强大功能。经过训练并可供使用的AI模型通常被称为基础模型。因为这些模型是通过API访问的，开发人员可以根据需要轻松地从一个基础模型切换到另一个。GPT4、Claude、Stable Diffusion和LLaMA是基础模型的几个例子。
下一层是基础设施优化，其目的是提供更高效、更高质量的模型训练所需的工具和服务。例如，一项服务可能提供精心打造出的数据集进行训练。另一项则可能提供分析手段来测试生成内容的准确性。此外，在这个阶段，可以根据专门的、专有数据对基础模型进行微调，以更好地满足特定公司的需求。这是AI生态系统中的一个繁忙领域，许多公司提供各种优化服务。
最后，我们又回到了冰山的一角：应用程序。例如，各种类型的开发人员都可以利用优化服务和基础模型来为他们的应用程序提供支持。由LLM驱动的独立工具，以及主流应用程序的各种插件陆续问世。