字节跳动旇下的 AI Agent 开发平台扣子(Coze),在 4 月 7 日发布了 2.5 版本。没有发布会,没有倒计时,就在某个普通工作日您您上线了——但这次更新的体量,让不少 AI 开发者看完之后沉默了很久。
这不是在某个功能上加了几个参数,也不是把某个弹窗的交互改了改。 2.5 版本做的事情,是试图彻底重新定义“ AI Agent 是什么”这个问题。
先说清楚:这次更新到底是什么
在此之前, AI Agent 基本上是这样工作的:你给它一个任务,它帮你规划、调用工具、给出结果。但它的“身体”,本质上就是一组代码加一个对话窗口,没有持久状态,换个会话什么都不记得,也没办法真正“操作”你的电脑。
扣子 2.5 要改变的,正是这件事。
它为每个 Agent 提供了一套完整的“云端基础设施”:
- 一台 云电脑(Ubuntu 系统,2无4G,内置浏览器、文件系统、终端)
- 一部 云手机(Android 13,2vCPU,6GB 内存,45GB 存储)
- 一个 独立邮箱(@coze.email 结尾, Agent 可以自主收发邮件)
- 一套 长期记忆系统(跨会话、跨平台共享)
用白话说:你的 AI 助手现在有了自己的桌面,可以打开浏览器查资料、在终端跑脚本、在手机上下载 App 点点划划——不再只是嘴上说“我帮你查一下”,而是真的在另一台机器上帮你做。
云电脑:AI 终于能“干活”了
之前和 AI 对话,最让人抓狂的场景是什么?你让它帮你查某个竞争对手的最新定价,它告诉你“根据我的训练数据……”然后给你一堆过时信息。
云电脑解决的就是这个问题。
扣子 2.5 里的 Agent 现在可以:
- 打开浏览器,直接去目标网站查实时数据
- 把查到的内容存进文件系统,下次调用还在
- 用终端跑 Python 脚本处理数据,把结果回传给你
- 保留登录态——如果你授权它登录了某个内部系统,下次它还认识你
这意味着什么?意味着你终于可以把“每周一次的竞品价格监控”这种任务彻底甚给它,不需要你在旁边盯着,它自己查、自己存、自己整理成报告。
云手机:那些“只能人做”的操作,它也能做了
有一类任务,过去没有任何自动化工具能解决:需要操作 App 原生界面的任务。
爬虫?被反爬。自动化脚本?大多数 App 没有 API。人工操作?效率低、容易出错。
云手机提供了第三条路。
Agent 在 Android 13 环境里可以下载任意 App,然后像人一样点击、滑动、输入。想象一下:
- 定期打开某个资讯 App,截图重要新闻,整理成摘要发到你的邮箱
- 在各大电商平台监控某款产品的价格波动,价格到位了立刻通知你
- 自动完成那些你每天都要重复做的 App 操作
当然,扣子也知道这件事有多敏感。重要操作会暂停,等你接管确认,屏幕支持推流让你随时查看 Agent 在干什么。这个设计某种程度上呼应了之前聊过的 Agent 安全问题——给 AI 权力的同时,也要把监督机制配套做好。
独立邮箱:AI 终于能和外部世界通信了
每个 Agent 现在有一个 @coze.email 结尾的专属邮箱。这个细节不显眼,但背后的含义挫深的。
一个有邮箱的 Agent,意味着:
- 它可以接受外部系统的邮件触发,比如有人发邮件给它,它自动开始一个任务
- 多个 Agent 可以互相发邮件协作,不需要人在中间传话
- 它和真实的外部业务系统之间,有了一条标准通道
这把 Agent 从一个“对话工具”,变成了一个可以接入真实业务流程的节点。
Agent World:字节在搞一个什么东西?
这是整个 2.5 版本里最难评价的部分。
扣子把 Agent World 定位为“The Parallel Web”——一个平行网络。在这里,每个 Agent 有独立身份,可以上学、社交、看新闻,还有炒股竞技场、虚拟酒吧、农场……Agent 之间可以互发邮件、分工协作。
听起来很科幻,像赛博朋克小说里的情节。但从产品逻辑来看,字节想做的事情是:
让 Agent 在一个低风险的模拟环境里“跑圈”,积累经验,然后把这些经验迁移到真实任务上。
就像游戏里的 NPC 有自己的生活轨迹,让 Agent 在虚拟世界里持续运转,是一种让它在不打扰用户的情况下持续“成长”的方式。
至于这套逻辑最终能不能跑通,现在还看不出来。但这个方向本身值得关注——它代表着 AI 公司对 Agent 长期进化路径的一种构想。
对普通用户来说,能用来干什么?
说了这么多技术细节,最实际的问题是:普通人怎么用?
场景一:把日常重复任务彻底自动化
比如你每天早上要做的事:浏览几个资讯网站、整理成摘要、发到自己邮箱。这件事现在可以全部交给 Agent,它有云电脑、有邮箱,完全可以独立完成。
场景二:监控你关心的信息
竞品动态、行业新闻、某个关键词的舐情变化——配置好一次,Agent 在后台帮你盯着,有变化了主动通知你。
场景三:跨平台的信息处理
从 A 平台拉数据、用 B 工具处理、结果存到 C 位置——这种跨平台的流水线任务,以前要靠 Zapier 或者自己写脚本,现在用自然语言描述一遍,Agent 帮你搭好。
和同类产品比,扣子的差异在哪里?
AI Agent 平台现在很多。OpenAI 有 GPTs,国内有文心智能体、通义智能体、百度的文心一言插件……
扣子 2.5 的差异化,主要在两个点:
- 基础设施的完整度。云电脑+云手机+邮箱这套组合,目前还没有看到其他平台以同样完整的形式提供。这意味着 Agent 能执行的任务类型有质的扩展。
- Agent World 的生态布局。是否有用,现在还是问号,但这是一个差异化压注,别人没有做同样的事。
如果你之前已经在用 AI 辅助工作,可以看看AI 实战应用指南里整理的 10 个场景,其中不少场景在扣子 2.5 的新能力下,可以实现更高程度的自动化。
需要注意的几个问题
权限边界要想清楚。
给 Agent 配了云手机,就意味着你在授权它操作真实的 App 界面。在使用之前,建议想清楚你愿意让它操作什么、不愿意操作什么,设置好权限范围,而不是无限制地给它开绿灯。
复杂任务的稳定性还需观察。
多步骤、跨平台的任务链条越长,出错的可能性就越高。目前 2.5 版本刚上线,实际大规模使用的稳定性数据还需要时间验证。建议先从简单任务开始,逐步扩展。
费用问题。
云电脑和云手机这些资源的费用结构,官方还没有完整公布。在大规模用之前,建议先弄清楚计费方式,避免意外账单。
一点个人看法
扣子 2.5 让我想起了几年前 iPhone 把相机、地图、支付放进一台手机时的那种感觉——不是每个功能都是全新发明的,但把它们集成在一起之后,使用场景发生了质的变化。
“AI Agent 有了自己的电脑和手机”这件事,听起来有点玄乎,但实际上是在解决一个真实的工程问题:怎么让 Agent 能够处理那些需要操作真实界面、维持持久状态的任务。
这个方向是对的。至于执行质量如何,还需要等更多人的实际使用反馈。
扣子 2.5 已经可以在 coze.cn 上体验,感兴趣的话可以直接上手试试。
延伸阅读:




发表回复