AI Agent

AI Agent 商业化 2026:从"会说话"到"会干活"的拐点

天际研究 · AI 实验室 · 2026.06.23 · 全文 14 页 · 预览 3 页

摘要

2026 年上半年,AI Agent 完成了从"会说话"到"会干活"的关键过渡:对话不再是终点,自主执行任务才是产品价值的核心。本报告(数据更新至 2026-06-27)以六组最新硬事件为锚,刻画这一拐点在供给侧与商业化各层的进程。模型层,OpenAI 在 Codex 上线 Record & Replay(2026 年 6 月 18 日),让 Agent"看一遍人操作"即可固化为可复用技能,把桌面自动化从写脚本变成演示一次。应用层,Sierra 以约 158 亿美元估值融资 9.5 亿美元、八个季度做到 1.5 亿美元 ARR;Glean 推出企业级 Agent 开发生命周期(ADLC)并跨过约 3 亿美元 ARR;Notion 把工作区变成 Agent 中枢,接入 Claude Code、Cursor、Codex 等外部 Agent。基础设施层,腾讯 QQ 邮箱推出 Agently Mail,首次给 Agent 配独立身份邮箱、支持 A2A 通信。资本与地缘层,腾讯等中方资本拟以约 135 亿元从 Meta 手中原价回购通用 Agent 标杆 Manus。我们认为,2026 年是 Agent 从"演示"走向"生产"的分水岭:可复现的执行、可治理的生命周期、可问责的身份,正取代单纯的模型能力成为竞争焦点;但约 88% 的试点未能进入生产,治理与可靠性仍是最大瓶颈。本报告为产业研究综述,不含任何基金业绩或投资建议。

关键发现

01执行取代对话成为产品核心:OpenAI 于 2026 年 6 月 18 日在 Codex 上线 Record & Replay,Agent 看一遍人操作即生成自然语言 SKILL.md 并可自主复现,把桌面自动化从写脚本变为演示一次,适配报销、发报告、建工单等稳定流程。
02应用层估值与营收齐飞:Sierra 于 2026 年 5 月以约 158 亿美元估值融资 9.5 亿美元(Tiger Global、GV 领投),八个季度做到 1.5 亿美元 ARR,称已覆盖逾 40% 的财富 50 强。
03Agent 工程化成型:Glean 5 月推出企业级 Agent 开发生命周期 ADLC(机会—设计—性能—上下文—开发—上线—监控改进七阶段),并于 5 月底跨过约 3 亿美元 ARR,距 1 亿美元仅 15 个月。
04工作区变 Agent 中枢:Notion 于 2026 年 5 月 13 日发布开发者平台,推出 Workers、数据库同步与外部 Agent,Claude Code、Cursor、Codex、Decagon 等可作为原生成员入驻,平台已建成逾 100 万个自定义 Agent。
05Agent 获得独立身份基础设施:腾讯 QQ 邮箱 6 月 23 日内测 Agently Mail,为 Agent 配与个人邮箱隔离的专属邮箱、实名制、写操作二次确认、防提示注入,并支持企业间 A2A 自动通信。
06资本与地缘重估通用 Agent:腾讯、红杉中国、真格等中方资本拟以约 135 亿元(约 20 亿美元)从 Meta 原价回购 Manus——此前该并购被外资安全审查叫停;Manus 年化收入据称已升至数十亿美元量级,拟独立赴港 IPO。

引言:对话结束的地方,工作开始的地方

数据更新至 2026-06-27。

过去两年,AI Agent 的讨论被一个隐含假设主导:模型越聪明,Agent 就越有用。2026 年上半年的事件链推翻了这个假设。竞争焦点不再是"谁的模型更会说话",而是"谁的 Agent 真的把活干完了、干对了、能被审计"。

这一转变有清晰的信号。OpenAI 6 月 18 日在 Codex 上线 Record & Replay:你做一遍,Agent 看一遍,然后它把流程固化成可复用技能反复执行——区别于传统 RPA 抓像素坐标,它生成的是可被推理模型解读的自然语言 SKILL.md。Sierra 八个季度做到 1.5 亿美元 ARR、以约 158 亿美元估值融资。Glean 把 Agent 开发拆成七阶段生命周期并跨过约 3 亿美元 ARR。Notion 把工作区变成 Agent 编排中枢。腾讯给 Agent 发了专属邮箱和独立身份。中方资本拟以约 135 亿元原价从 Meta 赎回 Manus。

这些事件分散在模型、应用、基础设施、资本四层,却指向同一件事:Agent 正在从"会说话"的演示品,变成"会干活"的生产资料。本报告沿这条主线,逐层拆解 2026 年中 Agent 商业化的拐点。

模型层:从"会推理"到"会复现操作"

模型层最重要的变化不是参数,而是"让模型的能力可被固化、可被复现"。

OpenAI 的 Record & Replay(随 Codex app 26.616 版本于 2026 年 6 月 18 日发布,面向 ChatGPT Plus/Pro/Business/Enterprise/Edu 付费用户、暂不含欧洲经济区、英国、瑞士)是这一逻辑的代表。它解决的不是"模型能不能做",而是"模型做的事能不能稳定重复"。用户演示一次任务,Codex 观察并生成自然语言 SKILL.md,之后由推理模型解读并自主执行。与抓像素坐标的传统 RPA 不同,它对界面微调有更强容错,最适合步骤稳定、成功标准清晰的有界流程:报销单、定期下载报表、批量建工单、发布视频等。

这背后是一条产业级判断:2026 年 Agent 的护城河正从"单次任务的智能上限"转向"任务的可复现率与可移交性"。一个能把内部专家的隐性操作流程沉淀为可复用资产的平台,比一个单点更聪明但每次都要重新提示的模型更有商业价值。Record & Replay 本质上把"人的操作"变成了"可被版本管理、可被审计、可被分发"的软件制品——这正是 Agent 工程化的前提。

应用层:ARR 曲线证明"会干活"能变现

如果说模型层回答"能不能干",应用层回答的是"干活能不能卖钱"——2026 年上半年的答案是肯定且陡峭的。

Sierra(OpenAI 董事长 Bret Taylor 与 Clay Bavor 联合创立)2026 年 5 月以约 158 亿美元估值融资 9.5 亿美元,Tiger Global 与 Google GV 领投,Benchmark、Sequoia、Greenoaks 等老股东跟投;估值较去年秋约 100 亿美元再跳一档。其 ARR 八个季度达 1.5 亿美元,据称已覆盖逾 40% 的财富 50 强,平台上的 Agent 处理着"数十亿次"交互——从抵押贷款再融资、保险理赔到退货管理与非营利募捐。

Glean 则把"卖 Agent"升级为"卖 Agent 工程方法论":5 月推出企业级 Agent 开发生命周期(ADLC),用机会、设计、性能、上下文、开发、上线、监控改进七个阶段把每个 Agent 绑定到明确 KPI,并配套 Auto-mode、深度 debug/trace、模块化子 Agent 与安全沙箱;5 月底其 ARR 跨过约 3 亿美元,距 1 亿美元仅 15 个月,且 AI 预算削减成了它的卖点。

两条曲线共同说明:当 Agent 真正接管"再融资、理赔、报表"这类有明确业务价值的流程时,客户愿意按结果付费,营收增速可以超过历史上任何一代企业软件。这也意味着竞争从"模型 demo"转向"可交付、可衡量、可治理"的产品工程。

📄 完整报告

完整报告共 14 页 · 仅向合格投资人与合作伙伴定向提供

以上为公开预览。完整版包含以下章节，依合规要求不在公开页提供、亦不提供免费下载——请联系天际同事索取。

🔒基础设施层:Agent 的身份、邮箱与 A2A 通信
🔒资本与地缘:Manus 回购与通用 Agent 的重估
🔒产业格局:谁在卡位 Agent 价值链的关键节点
🔒风险与瓶颈:88% 试点为何死在进生产的最后一公里
🔒展望:2026 下半年的三个关键变量

联系天际索取完整报告 →

本报告为天际资本 AI 实验室出品的产业研究，基于公开信息整理，不构成投资建议；不含基金业绩、AUM 或募资要约。