论文作者包括来自上海交通大学的杨滢轩、柴化灿、宋源祎、齐思远、温睦宁、李宁、廖俊威、胡浩毅、林江浩、刘卫文、温颖、俞勇、张伟楠,以及 ANP 社区发起人常高伟。
随着大语言模型 (LLM) 技术的迅猛发展,基于 LLM 的智能智能体在客户服务、内容创作、数据分析甚至医疗辅助等多个行业领域得到广泛应用。然而,不同智能体系统间的碎片化通信标准已成为制约其进一步发展的瓶颈。上海交通大学团队与 ANP 社区合作推出了首个全面系统的 AI 智能体协议综述《A Survey of AI Agent Protocols》,为解决这一关键挑战提供了清晰的指导框架。
ArXiv 论文链接:abs/2504.16736
Github 仓库地址:zoe-yyx/Awesome-AIAgent-Protocol
交互碎片化:阻碍智能智能体发展的关键瓶颈
正如早期互联网面临的通信标准分散问题,当前的智能智能体生态系统同样遭遇协议不统一的困境。研究团队指出,随着应用场景扩展和不同供应商、不同结构的智能体涌现,智能体与实体之间的交互规则变得越来越复杂。这种协议标准化缺失的问题体现在两个方面:一方面,它阻碍了智能体与外部工具和数据源的互操作性;另一方面,它限制了不同提供商或架构背景的智能体之间的无缝协作,从而限制了智能体网络的可扩展性,最终制约了智能智能体解决复杂实际问题的能力。
首创二维分类框架,清晰梳理智能体协议生态
论文创新性地提出了一个二维分类体系,将现有智能体协议分类为:
1. 对象导向维度:
上下文导向协议:专注于智能体与外部工具 / 数据源的通信,如 Anthropic 的 MCP 协议
智能体间协议:关注多个智能体之间的通信与协作,如 ANP、A2A 协议
2. 应用场景维度:
通用目的协议:适用于广泛场景的通用协议
领域特定协议:针对特定场景优化的专用协议,如 LOKA 用于人机交互,CrowdES 用于机器人智能体交互
这一分类法涵盖了主流协议,包括 Anthropic 的 MCP、Google 的 A2A、ANP 社区的 ANP、NEAR 基金会的 AITP、Eclipse 基金会的 LMOS 等十余种协议。详细分类表格中,论文还对每种协议的提出者、应用场景、关键技术和开发阶段进行了全面梳理,为开发者选择合适协议提供了清晰指引。
七大维度多角度评估,全面对比协议性能
研究团队从以下七个关键维度对各类协议进行了全面评估:
1. 效率:评估延迟、吞吐量和资源利用率,包括大语言模型智能体特有的 token 消耗成本
2. 可扩展性:衡量节点扩展性、链接扩展性和能力协商机制,提出了「能力协商得分」(CNS) 评估指标
3. 安全性:分析认证模式多样性、角色 / 访问控制粒度和上下文脱敏机制
4. 可靠性:检验包重传、流量控制和持久连接机制,引入「自动重试计数」(ARC) 等评估指标
5. 可扩展性:评估向后兼容性、灵活适应性和定制扩展能力
6. 可操作性:测量协议栈代码量、部署配置复杂度和可观测性
7. 互操作性:分析跨系统、跨浏览器、跨网络和跨平台适应性
论文特别强调,理想的智能体协议应平衡低延迟通信、资源消耗和任务完成速度,同时适应多智能体系统的复杂性。研究还通过 MCP 从 v1.0 到 v1.2 的迭代演进案例,以及从 MCP 到 ANP 再到 A2A 的协议系统演化案例,展示了智能体协议在功能、性能和安全性方面的多维度权衡。
真实案例解析:
四大协议在旅行规划中的应用对比
论文通过一个「策划北京到纽约的五日旅行」的真实用例,论文生动展示了四种不同协议架构的实际应用差异:
1. MCP(单一智能体调用工具):集中式架构,单一 MCP Travel Client 通过 Client-Server 结构依次调用 Flight Server、Hotel Server 和 Weather Server 等工具,所有通信必须经过中央智能体
2. A2A(多智能体复杂协作):分布式架构,将智能分散到多个专业智能体,如 Flight Agent、Hotel Agent 和 Weather Agent,智能体间可直接通信,A2A Travel Planner 作为非中心协调器主要收集最终结果
3. ANP(跨域智能体通信):跨域架构,通过标准化的跨域交互促进独立智能体间协作,明确划分航空公司、酒店和天气网站等不同组织边界,实现基于协议的跨域请求和响应
4. Agora(自然语言到协议生成):用户中心架构,将自然语言请求直接转换为标准化协议,引入三阶段处理过程(自然语言理解、协议生成、协议分发),使专业智能体专注于核心能力
这一案例分析帮助开发者根据实际需求(智能体自主性、通信灵活性、接口标准化和任务复杂性)选择最适合的协议方案。
未来展望
论文对智能体协议的发展前景进行了短期、中期和长期预测:
短期展望:从静态到可进化
评估与基准测试:开发统一的评估框架,超越任务成功率,纳入通信效率、环境变化适应性等方面
隐私保护协议:探索允许智能体交换信息同时最小化内部状态或个人数据暴露的协议
智能体网格协议:开发受人类群聊启发的通信模型,实现智能体组内通信透明度和共享访问
可进化协议:将协议视为智能体自适应能力的动态、模块化和可学习组件
中期展望:从规则到生态系统
内置协议知识:通过训练将协议内容和结构集成到大语言模型参数中,实现无需明确提示的协议兼容行为
分层协议架构:借鉴经典网络协议设计,将低级传输和同步机制与高级语义和任务相关交互分离,改善异构智能体间的模块化和可扩展性
长期展望:从协议到智能基础设施
集体智能与扩展定律:探索大规模、互联智能体群体中集体智能的涌现,研究智能体数量、通信拓扑和协议配置如何共同塑造系统级行为
智能体数据网络:构建专用于自主智能体通信和协调的基础数据基础设施,支持结构化、意图驱动和符合协议的智能体间信息交换
这项研究不仅系统梳理了当前 AI 智能体协议的发展现状,更为未来智能智能体互联互通的网络构建提供了理论基础和技术路线图。正如 TCP/IP 和 HTTP 协议的标准化推动了全球信息革命,统一的 AI 智能体协议有望催生一个全新的智能协作时代,实现不同形式的智能在系统间流动,工具与智能体无缝交互,形成超越单个组件能力的集体智能。