什么是人工通用智能(AGI)?
人工通用智能指的是能够在广泛的任务中以人类水平或更高水平理解、学习和应用知识的机器。与擅长国际象棋或图像识别等特定任务的专业 AI 不同,AGI 将具有自主学习和适应新挑战的灵活性,代表了许多人认为的人工智能研究的终极目标。
人工通用智能(AGI)几十年来一直是 AI 研究的终极目标。创造一台能像人类一样思考和学习的机器的想法不仅吸引了研究人员,也吸引了每个思考过技术未来的人。最近,OpenAI 的 Sam Altman 一直在谈论我们需要认真对待 AGI,建议我们可能构建一个可以处理我们扔给它的任何东西的巨大模型。
但有另一种看待这个问题的方式。一些聪明人认为 AGI 实际上可能从一起工作的多个较小、专业化模型中出现。让我们深入研究这两种方法,看看什么有意义,看看训练时间、GPU 成本和实际可行性方面的真正权衡。
方法 1:一个巨型模型统治一切
构建一个巨大的模型来实现 AGI 听起来很酷,对吧?但要使这项工作,我们需要解决一些严重的技术挑战:
训练数据:
我们谈论的是涵盖基本上人类知道和做的一切的巨大数据集。
模型架构:
我们需要极其复杂的神经网络,可以处理不同类型信息之间的疯狂复杂关系。
计算能力:
这将需要大量的 GPU 能力、TPU,或者可能我们甚至还没有发明的定制硬件。
当然,拥有一个模型可能听起来更简单,但它带来了一些真正的麻烦:
过拟合:
模型可能对其训练数据变得太舒服,难以处理任何新东西。
认知过载:
想象一下试图一次成为所有事情的专家——这基本上就是我们要这个模型做的。它可能不会很好地工作。
方法 2:专家团队
另一种方法就像建立一个专家团队,而不是试图创造一个无所不知的人。每个模型非常擅长一件特定的事情——无论是理解语言、识别图像还是玩游戏。
利基专业知识:
模型可以专注于它们最擅长的。一个用于语言,另一个用于图像,另一个用于逻辑推理——你明白了。
迁移学习:
一个模型学到的东西可以帮助其他模型更快地学习,这比每次都从头开始要高效得多。
这种方法有一些明显的好处:
模块化:
每个模型更小,更容易训练,所以你不需要超级计算机来运行它们。
灵活性:
你可以根据你试图解决的问题混合和匹配这些专业模型。
鲁棒性:
当你有多个专家一起工作时,整个系统变得更可靠。
但这并不都是一帆风顺:
协调:
让这些不同的模型相互交谈和一起工作是棘手的。
集成:
你需要聪明的方法来组合所有这些专业模型的成果。
这些方法如何比较?
| 一个巨型模型 | 专家团队 | |
|---|---|---|
| 训练时间 | 永远,非常复杂 | 分解时快得多 |
| GPU 使用 | 需要大量计算能力 | 可以跨多台机器分布工作 |
| 实际可行吗? | 由于认知负载和过拟合问题相当困难 | 由于模块化方法更现实 |
让我们说实话——构建 AGI 很难。两种方法都有其优点,但专家团队方法似乎更实际,可能更快工作。
随着我们继续向 AGI 推进,我们需要不断尝试新架构、训练方法和集成一切的方式。未来可能是两种方法的某种混合——从每种方法中获取最好的部分,并找出如何让它们很好地一起玩。
更新:AGI vs AI 术语转变
自从我在 2024 年 3 月第一次写这篇文章以来,OpenAI 谈论人工智能的方式发生了一些有趣的事情。如果你一直在关注他们最近的公告和 Sam Altman 的演讲,你可能已经注意到一个微妙但重要的变化——他们更多地使用”AI”,更少使用”AGI”。
但 OpenAI 最近的信息传递中还有另一个有趣的转折。他们一直在更多地谈论”代理”——实际上可以做事情而不仅仅是谈论它们的 AI 系统。街上的消息是他们可能很快宣布一些叫做”Agent Builder”的东西。
当你想到它时,这完全有意义。他们没有追逐 AGI 的圣杯,而是专注于可以处理特定任务并一起工作的实用 AI 代理。这就像他们从我们讨论的”一个巨型模型”方法转向看起来更像”专家团队”模型的东西。
也许他们已经意识到”AGI”这个术语设定的期望太高,造成了不必要的压力。当你不断承诺 AGI 时,人们期望一些可以像人类一样做任何事情的东西——我们还没有到那里。
通过专注于”AI 代理”,OpenAI 可以谈论实用的、工作的系统,而不会被 AGI 定义问题困住。老实说,这是更聪明的营销。他们可以展示他们的模型今天实际上可以做什么,同时构建更复杂的基于代理的系统。
有趣的部分是,这种转变没有改变我们在这篇文章中讨论的底层技术挑战。无论你称它为 AGI、AI 还是代理,我们仍然面临关于架构、训练和集成的相同基本问题。
如果有的话,这种以代理为中心的方法使”专家团队”模型更加相关。未来可能不是一个神奇的 AGI 模型,而是一起工作的专业 AI 代理集合——这基本上是我们已经在 ChatGPT、DALL-E 和其他专业模型等工具上看到的。传闻中的 Agent Builder 可能是他们让任何人更容易创建和组合这些专业代理的方式。
随着我们探索 基于记忆的代理学习 和其他持续适应方法,我们可能会发现通往 AGI 的道路涉及专业能力和有效集成它们的机制。
参考文献
OpenAI: “Artificial General Intelligence” 斯坦福大学:“The Future of Artificial General Intelligence”
Frequently Asked Questions
一个巨型模型和多个专业化模型之间的主要区别是什么?
主要区别在于方法——一个巨型模型试图在单个系统内处理一切,而多个专业化模型在专家之间划分任务。专业化方法通常更实用,因为它更容易训练、更模块化,并可以利用模型之间的迁移学习。
为什么专家团队方法更实用?
专业化模型更实用,因为它们更小、更容易训练,可以并行开发,提供混合和匹配能力的灵活性,并通过冗余提供鲁棒性。它们还避免了困扰巨型、单一模型的认知过载和过拟合问题。
构建 AGI 的主要挑战是什么?
关键挑战包括创建可以跨领域泛化的系统、开发高效学习机制、确保安全并与人类价值观保持一致、实现推理和常识能力,以及管理大规模训练所需的巨大计算资源。
迁移学习如何帮助开发 AGI?
迁移学习允许在一个领域获得的知识加速另一个领域的学习。当你有多个专业化模型时,一个模型学到的东西可以帮助其他模型更快地学习,使整体开发过程比每个功能从头开始更有效。
AI 代理在通往 AGI 的道路上扮演什么角色?
AI 代理代表了一种构建越来越有能力系统的实用方法。通过结合可以自主行动的专业化模型,我们可能逐渐接近 AGI 类似的能力,而不需要单个单一系统。这与”专家团队”方法一致。
我们离实现 AGI 还有多远?
估计差异很大,从几年到几十年不等。向基于代理系统的转变表明了一条更渐进的道路,而不是单一突破。进展取决于架构、训练方法的进步以及我们对智能本身的理解。
AGI 开发的安全问题是什么?
安全问题包括确保 AGI 系统与人类价值观保持一致、保持有意义的人类控制、防止目标不一致的意外后果、管理经济中断,以及为越来越强大的 AI 系统建立强大的治理框架。
AGI 会看起来像人类智能吗?
不一定。AGI 可能通过非常不同的机制实现类似的能力,就像飞机飞行方式与鸟类不同一样。重点应该是能力和一致性,而不是精确复制人类认知。AI 可能发展出自己不同于人类思维模式的”认知策略”。
About the Author
Vinci Rufus 是一位软件工程师和 AI 研究员,探索围绕人工通用智能的技术和哲学问题。他撰写关于推进 AI 能力的实用方法、不同架构方法之间的权衡,以及该领域在实践中与理论中的演变方式。他的工作强调对进展的现实评估和可实现的前进路径。