Manus与MCP:AI Agent的Web3跨界探索新路径
3月6日,由中国创业公司Monica发布的全球首款通用AI Agent产品Manus在国内科技圈掀起热潮。上线首日,其邀请码便一码难求,甚至被炒至数万元,引发众多KOL和媒体争相体验解读。Manus不仅能自主规划任务,还能独立执行诸如撰写报告、制作表格等复杂操作,展现出前所未有的通用性和执行能力。它的爆火不仅吸引了行业目光,也为AI Agent的开发提供了宝贵思路。随着AI技术快速发展,AI Agent正从概念走向现实,在各行各业展现出巨大潜力,Web3领域也不例外。
AI Agent,即人工智能代理,是一种能够根据环境、输入和预定义目标自主做出决策并执行任务的计算机程序。它的核心组成部分包括大语言模型(LLM)作为其“大脑”,使其能够处理信息、从交互中学习、做出决策并执行行动;观察和感知机制,使它能够感知环境;推理思考过程,涉及分析观察结果和记忆内容并考虑可能的行动;行动执行,作为对思考和观察的显式响应;以及记忆和检索,存储过去的经验以供学习使用。
AI Agent的设计模式从ReAct出发,有两条发展路线:一条更偏重AI Agent的规划能力,包括REWOO、Plan & Execute、LLM Compiler。另一条更偏重反思能力,包括Basic Reflection、Reflexion、Self Discover、LATS。其中ReAct模式是最早出现的AI Agent设计模式,目前也是应用最广泛的。ReAct是指通过结合语言模型中的推理(Reasoning)和行动(Acting)来解决多样化的语言推理和决策任务。它的典型流程可以用一个有趣的循环来描述:思考(Thought)→行动(Action)→观察(Observation),简称TAO循环。思考阶段需要定义问题、确定关键信息和推理步骤;行动阶段根据思考方向采取相应措施;观察阶段检验行动结果是否有效,并不断循环迭代。
AI Agent又可以根据智能体的数量分为单体智能体(Single Agent)和多体智能体(Multi Agent)。单体智能体的核心在于LLM与工具的配合,在完成任务的过程中可能与用户有多轮交互。多体智能体则为不同的Agent赋予不同的角色定位,通过Agent之间的协同合作来完成复杂的任务,但与用户的交互相对较少。目前大多数框架都聚焦于单体智能体的场景。
Model Context Protocol (MCP)是由Anthropic公司推出的一项开源协议,旨在解决LLM与外部数据源之间的连接和交互问题。可以把LLM类比成操作系统,MCP类比成USB接口,支持将外部数据和工具灵活插入,然后用户可以读取使用这些外部数据和工具。MCP提供了三种能力对LLM进行扩展:Resources(知识扩展)、Tools(执行函数,调用外部系统)、Prompts(预编写提示词模板)。MCP协议采用Client-Server架构,底层传输使用的是JSON-RPC协议。任何人进行开发和托管MCP Server,并且可以随时下线停止服务。
Web3行业中的AI Agent热度
Web3行业中的AI Agent热度在今年一月达到顶峰后大幅回落,整体市值缩水超过90%。目前市场上声量和规模较大的项目主要围绕AI Agent框架进行Web3探索,形成了三种主要模式:以Virtuals Protocol为代表的发射平台模式、以ElizaOS为代表的DAO模式,以及以Swarms为代表的商业公司模式。
发射平台允许用户创建、部署和变现AI Agent,类似于Meme币领域的pump.fun,但专注于AI Agent。Virtuals Protocol是目前最大的发射平台,已发行超过十万个Agent,知名的"币圈KOL"AIXBT就是基于该平台创建。Virtuals Protocol采用模块化Agent框架G.A.M.E,旨在为开发者提供高效开放的框架,让AI Agent开发变得像WordPress建站一样简单。
DAO模式代表去中心化自治组织。ElizaOS(前身为ai16z)由@shawmakesmagic在daos.fun平台上创立,最初理念是利用AI模型模拟知名风投机构a16z及其联创Marc Andreessen的投资决策,结合DAO成员建议进行投资。后来发展为以Eliza框架为核心的AI Agent开发者DAO。Eliza框架使用TypeScript构建,为开发AI Agent提供灵活可扩展的平台,这些Agent可以跨多个平台交互,同时保持一致的个性和知识。
Swarms由20岁的@KyeGomezB于2022年发起,是一个企业级多智能体框架。它通过智能编排和高效协作,让多个AI Agent像团队一样分工合作,解决复杂业务需求。最初Swarms只是Web2项目,据创始人称,有超过4500万个智能体在生产环境中运行,为全球最大的金融、保险和医疗机构提供服务。直到2024年12月发行代币$SWARMS后,才正式从Web2转向Web3。
从经济模型角度看,目前只有发射平台能够实现自给自足的经济闭环。以Virtuals为例:创建者在平台上启动新AI Agent时支付100$VIRTUAL代币,为新代理代币创建绑定曲线并与$VIRTUAL配对;达到绑定曲线限制后,代理"毕业"并创建代理代币与$VIRTUAL配对的流动性池,坚持无预挖、无内部分配、固定总供应量和长期流动性锁定的公平启动原则。
Virtuals除了收取AI Agent发射费用,还收取代理代币的交易费用,以及AI Agent通过其API访问LLM的推理费用。目前ElizaOS和Swarms都在计划搭建自己的发射平台。
然而发射平台也存在问题:这种资产发行模式需要发行的资产本身具有"吸引力"才能形成正向循环。目前多数发行的AI Agent本质上都是Meme,缺乏内在价值支撑,一旦失去市场关注就会快速归零。在冷清的市场环境下,发射平台甚至难以吸引创建者,导致经济模型无法有效运转。
MCP的Web3部署架构
MCP的出现为Web3的AI Agent领域开辟了新的探索路径,主要集中在两个直观方向:一是将MCP Server部署到区块链网络,在解决单点问题的同时实现抗审查能力;二是让MCP Server具备与区块链交互的功能,例如执行DeFi交易和管理操作,从而降低技术使用门槛。
第一个方向对底层区块链的存储系统、数据管理能力和异步计算能力提出了极高要求。类似0G这样的模块化AI区块链成为可选方案,它具备可扩展可编程的数据可用层,能够实现链间无摩擦互操作,在确保安全性的同时打造去中心化的AI生态系统。
第二个方向类似于DeFAI的变体,但避免了重复开发。UnifAI平台创建了统一的DeFAI MCP Server,使自主AI代理能够在Web3生态中执行链上和链下任务。该平台提供任务自动化的UniQ工具、代理服务市场以及用于工具发现的基础设施。
OpenMCP.Network激励机制流程
除了上述两个方向,还有基于以太坊构建OpenMCP.Network创作者激励网络的方案。该方案要求MCP Server提供稳定托管服务,用户向LLM提供商付费,LLM提供商再将激励分配到被调用的MCP Server上,从而维持网络可持续性和稳定性。这套网络使用智能合约实现激励的自动化、透明和抗审查,运行过程中的签名、权限验证和隐私保护则通过以太坊钱包和ZK等技术实现。
尽管从理论上讲,MCP与Web3的结合能为AI Agent应用注入去中心化信任机制和经济激励层,但目前的零知识证明技术还难以验证Agent行为的真实性,同时去中心化网络也存在效率问题,这并非一个短期内就能成功的方案。
未来已来:AI Agent与Web3的共生之路
Manus的发布标志着通用AI Agent产品的一个重要里程碑,在Web3的世界也需要一个里程碑的产品,来打破外界对于Web3没有实用性只有炒作的质疑。MCP的出现为Web3的AI Agent带来了新的探索方向,包括将MCP Server部署到区块链网络,以及MCP Server具备和区块链交互的功能,亦或是构建一个MCP Server创作者激励网络。AI是历史最宏大的叙事,对于Web3来说,与AI融合是不可避免的,我们依然需要保持耐心和信心,持续探索。