Skip to content

ANP协议诞生的这一年,感谢社区:web3、Agora Protocol、WebAgents、did:web

ANP开源项目从构思、开发,到现在已经接近一年的时间了。这一年我大部分精力都专注在这个开源项目中,去年更是从阿里离职,全职投入。

创业不容易,在融资环境这么差没有拿到钱的情况下,坚持做开源项目更加不容易。这里容许我佩服一下我自己,在一年之前提前看到了未来,并且能够坚持下来。

能够坚持下来当然不是因为我有韧性,而是因为这个过程很有趣。事情本身有趣,再加上开源社区的氛围,和全球开发者沟通交流,我最近一年的身体状态和心理状态比在阿里的时候更加的好。(只有钱包不满意)

做自己感兴趣的事情,事情本身会滋养你的身体和心理。

今天主要和大家分享一下ANP诞生的全过程,以及在这个过程中要感谢的社区。

最近越来越明显地感觉到,我们所看到的互联网未来的画面,正被越来越多的人所认同。我们也受到了越来越多的正反馈,也有越来越多的开源爱好者、同行者加入了我们开源社区。

ANP现在谈不上完美,我现在还有很多想法与规划,等待着去完善与实施。但是它已经是智能体通信协议当中一股重要的力量,我们代表了一条技术路线(Agentic web + 去中心化 + 语义网),并且在这条技术路线上,我们的探索一直在行业的最前沿。

起源

ANP起源于一个非常小的疑问(我原有的工作与音视频关系密切):人如何使用个人助手进行视频会议? 曾经有段时间,这个问题一直在大脑中挥之不去,压制不住。

深入研究之后,我发现行业智能体连接与协作上,还存在着巨大的技术空白。当前的技术是无法满足智能体的需求的,智能体需要更加原生的连接方式:所有智能体都能够互联互通、直接使用底层数据交互。

正式沿着这个路线进行思考、设计,才有了ANP协议。

在整个设计的过程中,ANP也经过了一次大的重构,并且吸收了其他社区的优秀思想。

web3

第一个对ANP产生重大影响的是web3社区。

我是在2022年,因为我非常认同个人数据主权的理念,我业余时间研究了web3,和很多web3从业者做过深入的交流。

在web3社区,我学习了区块链的技术,了解到了去中心化背后的理念与技术,后面又接触到了DID的概念,以及W3C的DID标准。还有很多非常有意思的协议比如Nostr、AT Protocol、Lens Protocol等。

去中心化也是ANP的核心理念,我们追求的不是区块链这样完全去的中心化,而是用于智能体身份互操作的整体去中心化、局部中心化思路。

W3C DID也是我们智能体身份的最底层技术,也是我们认为当下最适合智能体身份的技术。

最后说下web3社区。

web3虽然离钱很近、离用户有点远,但是web3有一套完全区别于web2(传统互联网)的价值观、世界观、技术体系,而且这些东西非常的有意思。

同时web3社区氛围也非常的开放,我非常喜欢web3的builder文化。还有DAO的组织方式,以及token的激励机制。这些都非常的有意思,对我设计ANP有很多影响与启发。

Agora Protocol

第二个要感谢的是Agora Protocol。

Agora Protocol是牛津大学一个团队和Camel AI一起开发的一个元协议技术,可以用于智能体之间协议的协商。

因为我一直从事协议相关工作,我很早也意识到了AI对协议协商、联调的影响,不过一直没有系统的研究过。

受Agora Protocol的启发,在更深入的思考之后,我正式形成了ANP的三层架构设计:身份与加密层、元协议层、应用协议层。

这个三层架构一直沿用至今,并且不断的补充完善。

我们元协议层在实现上主要参考的就是Agora Protocol的论文,并且结合我们在通信协议上的经验做了工程优化。

后来我与Agora Protocol的作者、牛津大学的smarro,以及Camel AI的创始人李国豪,都进行过智能体通信协议方面的技术交流。最近smarro牵头组建了一个工作组,致力于智能体通信协议的标准化,我们是主要参与者之一。

WebAgents

第三个要感谢的是WebAgents。

WebAgents是我们社区海外的一个同学James推荐给我的。

WebAgents主要是基于语义网技术,构建基于Web的多智能体系统(MAS)。我大量的翻阅了WebAgents社区的资料,特别是他们的会议记录,从里面获得了很多关于语义网的线索。

然后我系统的研究了语义网的起源,特别是万维网发明人Tim Berners-Lee关于语义网的文章,以及语义网相关的标准,包括json-ld、rdf、owl等。

语义网是一个非常有意思的概念,如果你看过Tim Berners-Lee 2001年在《科学美国人》上发表的关于语义网的文章,你一定会觉得他是一个非常有远见的人,里面描述的场景,正是我们现在设想的智能体普及之后的场景。

只是受限于以前AI的技术水平,语义网走了数据标注这个技术路线,注定无法真正地实现语义网设想的美好场景。而后来,互联网走向了更加封闭的移动互联网时代。

但是语义网遗留下来的技术,我认为可以很好的被用来做智能体之间的通信。它通过预先定义的语义,让不同智能体之间对一个数据有一致的理解。这可以很好的解决智能体使用自然语言通信的歧义问题。

这也是我们在智能体描述协议上核心技术选择。

did:web

第四个要感谢的是did:web。

did:web是W3C的DID的一个方法实现,它使用web技术,实现去中心化的身份,整体技术可以实现类似email的效果:全局是去中心化的,互操作性强,内部是中心化的,可以支撑数十亿用户。

我们最早采用的DID方法是did:all,这是一种类似比特币地址的、自验证的DID方法。它也基于web实现,但是我们的方法有一个致命的问题一直没有很好的解法:DID对应的私钥丢失后恢复问题。感兴趣的同学可以看下我们废弃文档中的备份。

后来我接触到了did:web的设计,它很好地解决了DID私钥丢失后的恢复问题,并且整体设计思路和我们非常类似。

所以,我们切换到了did:web的方案,同时增加了关于智能体的支持,比如添加智能体描述、智能体身份隐私保护、智能体身份的人类授权等,我们提出了一个新的方法did:wba(web-based agent)。

我在推特上也与did:web的作者做过沟通,未来我希望我们两个方法能够融合到一起。

开源与社区

ANP协议和关键的代码实现,都是MIT license,并且永远会保持MIT license。

我们在ANP的设计过程中,大量的吸收了开源社区的优秀成果,同时我们也希望能够回馈给开源社区。

我们认为,一个封闭的协议是没有前途的,一个没增量价值的开源是没有意义的。

在参与开源与建设社区的过程中,我看到了开源的力量与价值,我们也非常希望有更多的开发者、社区、公司能够参与到ANP社区的建设中来。

联系方式

AgentNetworkProtocol的目标是成为智能体互联网时代的HTTP协议。

我们的愿景是定义智能体之间的连接方式,为数十亿智能体构建一个开放、安全、高效的协作网络。

如果您对智能体通信协议感兴趣,欢迎加入开源社区,共同定义智能体之间的连接方式,探索Agentic Web的未来。

联系方式: