当我们设计一个协议的时候，我们在设计什么

协议是世界观的表达

当我们在设计一个协议的时候，我们在设计什么？这个问题可以从多个层面进行深入探讨。

协议的设计不仅仅是技术细节的堆砌，更是对整个世界运行规律的认知与理解，以及对未来发展趋势的一种判断。协议描述的是一个世界模型，这个模型描述了世界运行的规律，以及未来发展的方向。它需要设计这个世界模型中有哪些角色、不同的角色之间如何进行交互。

历史上的每一个成功协议，都体现了设计者对当时技术环境和未来趋势的准确把握。比如HTTP协议的设计反映了万维网创始人蒂姆·伯纳斯-李对信息共享和超文本系统的理解，它定义了客户端和服务器的角色，以及它们之间如何通过简单的请求-响应模式进行交互。正是这种简单而灵活的设计，使HTTP成为了互联网的基础协议之一。

智能体协议背后的世界观差异

在智能体通信协议领域，我们可以看到不同协议背后折射出的世界观差异。以当前较为知名的三种协议为例：MCP、ANP和Agora协议。

MCP：模型中心的世界观

MCP (Model Context Protocol) 的世界观是以模型为中心，整个互联网就是它的上下文。MCP是典型的客户端-服务端架构，客户端使用MCP协议连接到MCP服务器，然后访问服务器的各种信息和工具能力。

这种设计理念非常适合当前的互联网环境，它让AI模型能够方便地接入现有互联网资源，丰富Chatbot产品的能力。从某种程度上说，MCP将模型视为中心，将整个互联网视为模型的扩展。

MCP使用了基于OAuth的身份认证方案，这是互联网上广泛应用的标准，使得模型能够访问用户在现有互联网应用上的资源。在信息组织上，MCP使用JSON-RPC来读取/操作服务器的资源与工具能力，本质上可以理解为一种特殊的API调用。

（备注：这段可以讲下最近AI编程工具比如cursor对MCP的支持，你可以查找资料）

ANP：智能体网络的去中心化视角

ANP (Agent Network Protocol) 的世界观则完全不同。它是去中心化的，智能体互相平等连接。ANP是典型的P2P（点对点）架构，任意一个智能体都可以使用ANP连接到另外一个智能体，不存在中心化的服务节点。

ANP的身份认证基于W3C DID标准，重点解决智能体之间的跨平台互操作性问题，让所有智能体都能互联互通。在信息组织上，ANP以语义网的Linked-Data技术为核心，目的是构建一个便于AI访问、便于AI理解的数据网络。

这种设计理念更适合下一阶段智能体互联网的发展，它预见了一个由无数智能体组成的网络，每个智能体都具有同等地位，可以自由连接和交互。

Agora：自然语言交互的未来展望

Agora协议则代表了更远的一种可能性，它认为未来智能体之间可以直接使用自然语言进行交互。这种想法在未来是可能实现的，因为随着AI技术的发展，智能体之间甚至可能进化出自己的语言形式，而自然语言可能只是一个过渡阶段。

这三种协议代表了智能体发展的三个不同阶段：MCP解决当下的问题，ANP解决下一步的问题，而Agora则在探索更远未来的可能性。它们在背后反映了每个设计者对当下的判断，对未来的一个预测，对整个世界运行规律的认知，以及他们背后的设计理念。

协议成功的决定因素

哪个协议最终能够胜出？生态、技术、能力都非常重要，但最根本的是什么？是协议是否符合未来行业的发展方向，这才是最重要的一点。也就是说，协议设计者在背后对整个世界模型的认知，以及对未来发展的一个判断，决定了协议未来是否有足够大的生命力。

推动互联网演进的最本质问题，是如何最大限度地释放新技术的能力。PC互联网时期，Web技术释放了开放互联网的访问能力；移动互联网时期，APP释放了移动设备的全部潜力。在当下以及未来10年，新技术无疑是以生成式人工智能、大语言模型、智能体为代表的AI技术。如何释放AI的能力，决定了未来互联网的演进方向。

例如，德国电信基于传统互联网设计的协议，与我们基于智能体设计的协议，哪个更有生命力？如果未来物联网上也能够运行智能体，而且智能体要和物联网设备做非常深入的沟通，那么前者的路线可能会更有生命力。

历史经验：SIP与H.323的案例

历史上的案例可以给我们提供借鉴。以SIP和H.323为例，SIP是基于纯文本的协议，在最早期，它的处理效率并不高。而H.323是二进制协议，非常紧凑，非常省带宽。但最终胜出的是SIP而不是H.323，为什么会这样？

答案在于技术发展的大趋势：随着计算能力的不断提升，算力越来越强，字符串处理的效率已经不再是根本问题。SIP基于文本的特性使其更加灵活、可扩展，更易于调试和实现，这些优势在长期来看远比短期的效率优势更加重要。

这个案例告诉我们，协议设计不应该过于关注当前技术条件下的优化，而应该着眼于长期的技术发展趋势和易用性、灵活性等因素。

协议的未来：向自然语言演进？

展望未来，协议有没有可能全部进化为自然语言？这个是有很大概率会发生的，特别是控制层的协议。在传输媒体层的协议上，它可能还是保持现在的二进制形式，因为效率和精确性的考虑。但控制协议完全有可能进化为自然语言形式，而且我认为这个大概率会发生。

随着大语言模型能力的不断提升，自然语言作为人机交互和机器间交互的媒介将变得越来越自然。控制层协议使用自然语言有几个优势：

降低开发门槛：使用自然语言描述需求和功能，可以让更多非技术人员参与到协议设计和使用中。
提高灵活性：自然语言比严格格式的协议更加灵活，可以处理更多歧义和不确定性。
无缝集成：随着AI的普及，自然语言将成为人与AI、AI与AI之间最自然的交流方式。

区块链协议：另一种世界观的体现

最后，值得一提的是比特币协议，它是另一个反映不同世界观的重要例子。比特币协议体现了区块链、Web3背后的去中心化、不可篡改、共识机制等核心思想。

比特币协议设计了一个没有中心节点、基于数学和加密学原理的价值传输系统，它不依赖于任何中央机构或信任第三方。这种设计背后反映的是对传统金融体系的不信任，以及对一个更加开放、透明、无需信任的经济系统的向往。

智能体互联网的愿景

未来的智能体互联网会呈现什么样的特性？基于我们的研究，智能体互联网可能具有以下特点：

智能体渗透到互联网的各个角落：一个人或组织可能有多个智能体为其服务。
所有智能体之间都可以互联互通：这是释放AI能力的必要条件。
个人助手成为互联网的新入口：智能体之间的连接远大于人与智能体之间的连接。
网络更加扁平化：智能体之间可以直接连接，无需三方平台的中介。

在这样的背景下，什么样的协议能够胜出？我们认为，最终胜出的协议必须能够支持智能体之间的无缝连接与协作，必须足够灵活以适应未来AI技术的飞速发展，同时还要具备可扩展性和安全性。

结语

协议设计是对世界的一种理解和塑造。当我们设计一个协议时，我们不仅仅是在设计技术细节，更是在描绘我们心目中的世界运行模式，以及我们对未来的期望和预测。

成功的协议不仅仅取决于其技术优势，更取决于它是否符合技术发展的大趋势，是否能够最大化地释放新技术的能力。在智能体时代，我们需要的协议应该能够支持智能体之间的自由连接、高效协作，同时为人类创造更多价值。

无论是MCP、ANP还是其他协议，它们都在尝试描绘未来智能体互联网的蓝图。只有那些真正理解技术发展趋势，并能够适应未来需求的协议，才能够在历史长河中留下自己的印记。

当我们设计一个协议的时候，我们在设计什么 ​

协议是世界观的表达 ​

智能体协议背后的世界观差异 ​

MCP：模型中心的世界观 ​

ANP：智能体网络的去中心化视角 ​

Agora：自然语言交互的未来展望 ​

协议成功的决定因素 ​

历史经验：SIP与H.323的案例 ​

协议的未来：向自然语言演进？ ​

区块链协议：另一种世界观的体现 ​

智能体互联网的愿景 ​

结语 ​