LLM是否消除了对编程语言的需求？

创作时间:

作者:

@小白创作中心

LLM是否消除了对编程语言的需求？

引用

来源

https://www.53ai.com/news/neirongchuangzuo/2024110701286.html

随着大型语言模型（LLM）在编程领域的广泛应用，一个引人深思的问题浮现出来：当人工智能能够编写代码时，传统的编程语言是否仍然具有存在的必要？本文将从多个维度探讨这一问题，并分析LLM与编程语言之间的关系。

“人机”规范

学习编码之初，我对其整个堆栈的工作原理产生了浓厚的兴趣，甚至参与了编程语言的设计与实现。在这个过程中，我形成了一个基本观点：编程语言是人类用来向计算机表达代码意图的抽象工具。源代码本质上是编译器或解释器的“配方”，它们将人类可读的代码翻译成计算机可以理解的形式。

正如Donald Knuth所说：“程序员的心理分析主要是将抽象层次从低级转移到高级的能力。从小处看问题，从大处看问题。”因此，编程语言的设计应该注重表达机器功能的清晰性，允许精确指定算法或设计，并通过简洁的语法让聪明的程序员高效完成工作。这也是C++等面向专家的语言积累大量语法糖和核心功能的原因之一。

然而，随着经验的积累，我逐渐认识到这仅仅是编程语言功能的一部分。

“人与人”规范

在实际开发中，我发现大多数有趣的项目都是团队协作的结果，而且规模往往很大，以至于很难将所有代码都牢记于心。在这种情况下，软件开发领域出现了新的动态：设计讨论、代码审查和第三方库/包集成。我参与过的最成功、最有成就感的软件开发项目，都是与一群才华横溢、敬业的人共同完成的。

在这种团队协作的背景下，编程语言的目的逐渐演变为一种抽象工具，用于帮助一个人向另一个人表达关于程序行为的意图。虽然这仍然需要明确的规范，但目标发生了变化：语言应该被设计成易于阅读，而不仅仅是易于编写。计算机非常宽容和理解（尤其是随着LLM的兴起），所以我们中的许多人都受益于清晰的设计模式和易于理解的代码。大多数代码最终只被编写一次，但会被多人阅读和迭代多次。

正如Harold Abelson和Gerald Jay Sussman所说：“程序是供人类阅读的，只是偶尔供计算机执行。”因此，过于巧妙的语法糖可能会违背语言的核心目标。专门的语法和不常用的功能可能会让那些没有编写过代码的人难以理解。虽然LLM和其他工具可以帮助解码或解释过于复杂的代码，但保持单一、可读的真相来源是理想的。

“计算机到人类”规范

通过这种视角，基于LLM的代码生成工具就像一个新团队成员，在项目中贡献、阅读和操作代码。有许多不同的例子，具有不同的特性和功能，例如，人工生成代码的提示、审查代码并提供改进建议的AI专家、自动生成单元测试的工具，以及其他新功能不断涌现。这些工具的定义特征是计算机生成集成到产品中的源代码。

虽然这些功能令人难以置信，但至少在不久的将来，这些代码生成工具不会取代编程语言的现有功能。事实上，当今对语言模型的主要担忧之一是信任——在某些情况下，它们可以产生惊人的结果，但在其他情况下，它们往往存在微妙的错误，有些是不确定的。因此，设计一种可供阅读而不仅仅是供其他人编写的语言变得更加重要，这样我们人类就可以审查和批准生成的代码。

让我们考虑一些例子：如果你提示LLM为你构建一个处理在线购买的移动应用程序，你会在不审查源代码以确保其正确计费的情况下发布它吗？或者，更极端的是，你愿意用LLM编写的代码将人类送上月球吗？这引出了开发人员的终极问题——我们愿意接受什么样的错误和成本？当今LLM的不可靠性意味着，作为代码所有者，我们需要知道提示是否生成了具有正确行为的东西——生成的代码实际上做了什么？这也是为什么直接生成低级机器代码的LLM对于一般用例来说并不有趣——很少有人愿意阅读、审查和验证机器代码。

展望未来，我们希望LLM能够增强开发人员的体验，并随着时间的推移变得更加可靠和值得信赖。但即使事实证明这是真的，LLM仍然无法取代对编程语言的需求。LLM很可能成为高效（“懒惰”）开发人员的关键扩展——与从在线参考资料中复制/粘贴相比，这是一个实质性的提升。此外，虽然LLM很可能会自动消除编程的样板和重复部分，但总会有一些用例需要人为干预。

虽然没有人知道未来，但我们认为人类将需要在许多应用程序中参与相当长一段时间——特别是在错误率低且由此产生的成本高的情况下。

LLM最适合输出的编程语言是什么？

那些深陷软件开发的人会发现自己被各种各样的语言包围着，这些语言旨在解决各种领域的问题。你可能遇到过用于人工智能和数据科学的Python、用于低级编程的C和C++、用于Web的JavaScript或TypeScript、用于构建移动应用程序的Swift和Kotlin以及用于加速器编程的CUDA。这些都是很有价值的语言，但鉴于LLM减少了关心语法可写性的需要——编程语言的哪些品质在这个新时代很重要？

我们认为，在我们走向人工智能辅助世界的过程中，编程语言有三个基本方面会使其特别有用——它在许多领域的可用性和可扩展性、现有的训练数据量以及丰富而充满活力的生态系统。让我们依次介绍一下：

语言的第一个最关键部分是语言实现的可用性和可扩展性。最适合LLM的语言是高度可用且易于人类阅读的语言，但其实现可以扩展到许多不同的用例和应用程序。不幸的是，许多语言实现包括排除某些应用程序的设计决策。例如，标记/清除垃圾收集不适用于低级系统软件和加速器编程，Python和其他解释型语言在需要性能、并行性和线程时并不理想，而JVM或基于.NET的语言并不适用于需要小型和低依赖性二进制文件的用例。

为了训练能够在许多不同用例和应用程序中生成高质量程序的LLM，我们需要一个广泛的训练数据语料库来为模型提供种子。与没有现有代码可供训练的小众或新奇语言相比，LLM在具有大量开放示例的流行和成熟语言（如Python）上的效果要好得多。

最后，我们认为LLM需要一个丰富而充满活力的生态系统。即使对于现有的基于LLM的解决方案，丰富的社区也已经开发了提示库、工具和专业知识，从而形成了下一代生态系统。从这个观点来看，语言应该被设计成能够解锁庞大的开发者社区——无论我们选择在这个新世界中如何定义开发者，从传统编程到指令提示等等。

当我们查看大量现有的编程语言时，我们会看到该领域的许多点，但它们都提供了针对不同细分市场优化的权衡。我们如何推动最先进的技术向前发展？在我们看来，Mojo是成为LLM理想语言的有力竞争者，因为它满足上述所有三个基本方面。