从技术架构到产品战争:深度拆解Agent赛道的两条路线与五个判断
2024年的科技行业叙事,可以用一个词来概括:龙虾。这个代号指向的正是OpenClaw——一个让AI从聊天机器人进化为真正能执行任务的智能体框架。字节、腾讯、阿里、百度,还有月之暗面、MiniMax、智谱,新旧势力在这一刻形成了罕见的共识。
时间线回溯:为什么是现在
三月的喧嚣源于技术路线的确认。OpenClaw证明了Agent可以有清晰的产品形态:人格化、永远在线、主动执行。这三个特征让龙虾第一次有了区别于聊天机器人的清晰轮廓。四月,战局从极客工具转向服务大众的系统,各家开始构建基础设施,寻找落地场景。这是产品化的关键一跃。
两条技术路线:封装与自研
第一条路线是封装OpenClaw。QClaw、AutoClaw、MaxClaw、DuClaw、ArkClaw——这些产品的共同选择是围绕OpenClaw已验证的能力做产品化包装。部署时间从小时级压缩到20秒,云端托管、预置Skill、免费额度、主流IM接入打包交付。这套玩法的核心逻辑是:OpenClaw太像开发者系统,需要有人把它翻译成普通用户能理解的语言。字节和腾讯靠此变现用户基础,大模型公司则将其视为Token消耗的绝佳载体。
但封装路线有个脆弱前提:依赖上游不生长。OpenClaw每次版本更新都在悄悄挤压第三方产品的独立空间。这是大厂选择两条腿走路的原因。
第二条路线是自研CodingAgent,搭建自己的执行底座。阿里更坚定地走这条路,通义实验室的QwenPaw、钉钉的悟空,都在把平台能力CLI化,让Agent原生调用而非模拟人操作。腾讯的WorkBuddy、字节的扣子2.5也在改造成自己的执行底座。
Cowork给出了另一种哲学分野:不是追求Agent的极致自主,而是更好的人机协作关系。从有用助手变成真正同事——这个转变意味着什么?意味着人类需要在AI工作过程中保持深度介入能力。
两个关键动作:CLI复兴与协作界面
第一个关键动作是CLI的复兴。Agent发展正在分化出两个界面:GUI服务人和软件交互,CLI服务软件和Agent交互。龙虾类产品很可能将对话框与CLI结合,取代GUI主导的交互范式。
钉钉把办公能力CLI化,把自己改造成适合Agent操作的执行层;飞书将协作能力接口化,定位成人类和AIAgent都能操作的命令行工具。这是在传统软件上长出一套可以被Agent调用的操作界面。CLI打通软件到Agent的接口,频道打通人到Agent的入口——两者共同完成旧世界和新世界之间的接线工程。
第二个关键动作是人类与Agent的协作范式选择。一个方向是大一统操作系统底座,用通用平台承载Skill,由Skill覆盖无数垂直场景,像微信小程序生态。另一个方向是App的Agent化,多入口与多样垂直Agent构成类似当前APP生态的行业格局。
第一个选择更符合人机交互习惯,但对话框未必是最佳方案。NotebookLM的三框工作界面、Flowith的画布式工作界面,都在探索新的可能。关键在于Skill生态的丰富程度,它将决定人与Agent交互界面的最终形态。
五个核心判断
判断一:CodingAgent正在成为新一代Agent的操作系统底座,竞争焦点是交付完成度。
判断二:从500万工程师到10亿普通用户,核心障碍是产品化而非模型能力。
判断三:封装路线快速圈用户,但依赖上游稳定;自研路线更重更封闭,但能把Agent深度绑定进生态和权限体系。
判断四:Skill生态的丰富程度决定交互界面的最终形态。
判断五:人类暂时无法冀求无需工作的丰裕社会,但一个编排良好的Agent,确有让人五点下班的可能性。
自动驾驶行业早就给出了答案:L4定义方向想象空间,L2赢得真实市场。原因不在于技术先进与否,而在于L2更务实地处理了人与机器之间需要时间积累的信任关系。
实战方法论
如果你正在评估Agent产品,核心看三点:部署门槛是否足够低、生态接入是否足够开放、人类介入通道是否足够畅通。如果你想在Agent时代占据有利位置,需要理解Skill封装将成为关键能力——把人类经验、工作流、行业know-how压缩成可被Agent调用的模块。
百虾大战的终局,不会属于技术最先进的那个,而属于最先找到人类信任边界并能跨越那条鸿沟的产品。
