多智能体才是未来?谷歌:OpenAI齐下场:争抢AGI人才
两年前,OpenAI推出的ChatGPT将AI大语言模型带入公众视野,引发全球关注。随后各科技巨头纷纷发布自有模型,初创企业也大量涌现。但自GPT-4去年3月推出以来,LLM进展似乎陷入停滞。备受期待的GPT-5迟迟未至,开源与闭源模型差距急剧缩小。AGI目标在GPT-4发布时看似触手可及,如今却因幻觉、逻辑缺陷和性能衰退等问题再次变得模糊。那么,当前人工智能发展的下一阶段是什么?答案或许在于多智能体系统,这从谷歌和OpenAI近期的招聘中可见端倪。
多智能体研究团队招募进行中
9月20日,OpenAI研究员Noam Brown在X平台宣布,新多智能体研究团队正在招聘机器学习工程师,候选人需具备丰富的大语言模型工程经验。

AI智能体的发展符合OpenAI近期提出的通用人工智能进展五级标准中的第三级。目前,OpenAI自认为是处于第二阶段,即“推理者”阶段。最新推出的o1模型正是此阶段的代表作品。据《The Information》报道,OpenAI一直在开发两种类型的AI智能体,用于自动化复杂任务。一种类型旨在控制设备,如文档间传输数据或完成报销报告;另一种则专注于网络任务,如收集公共数据或预订航班。
9月23日,谷歌同样发布了多智能体岗位的招聘信息。

早在今年五月,谷歌DeepMind CEO Demis Hassabis在彭博社采访中表示,AI发展的下一步是开发自主人工智能代理。这些代理不仅能回答问题,还能独立规划和行动。此类系统预计在未来一到两年内投入使用。
多智能体系统
多智能体系统是当代人工智能研究的重要领域,由多个相互交互的智能体构成。这些智能体是能够感知环境、学习模型、做出决策并采取行动的自主实体,可以是软件程序、机器人、无人机、传感器、人类或它们的组合。系统中每个智能体都具备特定专长和目标,例如可开发分别专注于总结、翻译、内容生成的独立智能体,它们共同工作,共享信息,并以灵活可定制的方式分工合作。

与GPT等单体大语言模型相比,多智能体系统具有显著优势。
- 专门化:智能体可针对特定任务优化,而非在单一模型中容纳所有能力,从而提高效率和性能。
- 定制化:用户根据需求灵活组合不同智能体,团队组合可随使用场景调整。
- 可扩展性:单个智能体可独立更新或替换,无需重新训练整个模型,更易于迭代改进。
- 可解释性:使用多个智能体时,更容易理解不同组件对系统整体行为的贡献,而单体模型通常是“黑箱模型”。
在实际应用中,优势更为突出。
- 灵活性与扩展能力:通过增加、移除和修改智能体,灵活适应变化环境,解决复杂问题。
- 鲁棒性与可靠性:控制去中心化使系统即使部分组件失效仍能运行,容错能力强。
- 自组织与协调:智能体基于“涌现行为规则”自组织,实现分工、协调决策和冲突解决。
- 实时操作:无需人为监管即可立即响应环境变化,适用于灾害救援、交通优化等场景。
多智能体系统过去常受限于智能体复杂性、通信不安全及协调困难。然而,随着现代AI解锁更智能、自适应且可扩展的实现方式,这些系统在构建响应迅速且具弹性的体系中日益重要。未来应用场景涵盖集成交通的智能城市、分布式发电的清洁能源,以及利用患者数据的精准医疗。

AI多智能体系统为这些构想提供了实际应用的计算基础,也为解决各行业复杂现实问题提供了新方案。随着分布式智能模仿自然生态系统,多智能体系统必将成为构建更高效、响应更迅速、更具弹性的未来世界的关键方法。