不写 Prompt 了，AI 现在能”看你干活”：6 月 17-19 日这两个新工具，让 Agent 真正替你跑腿

如果你最近在用 AI 工具，可能有一个感受：模型越来越聪明，但真正帮你把活干完还是费劲。

写 Prompt 写到抓狂，结果 AI 给的答案跟你想要的差十万八千里——这其实是过去两年用大模型干活的主旋律。你描述任务，模型理解任务，中间这一道”翻译”天然有损耗。

但 6 月 17 日到 19 日这三天，两件东西同时冒出来，把”自动化”这件事的门槛狠狠往下踩了一脚——而且都跟”不再写 Prompt”有关。

6 月 18 日，国产 uniTerm v1.0 正式发布（Apache 2.0 协议），把”Claude Code 级别”的 AI Agent 嵌进了终端——你不用打开 IDE、不用写 Prompt，直接在终端里跟它说”帮我看看这台服务器上为什么磁盘满了”。
6 月 19 日，OpenAI 在 Codex Thursday 上线 Record & Replay：你在 Mac 上把活儿演示一遍，Codex 直接把你这次操作录成一份能复用、能改的 Skill——以后这活儿它自己干，连 Prompt 都不用写。

再加上 6 月 17 日正式开源的智谱 GLM-5.2（我们在6 月 15 日那篇文章详细分析过），三件事凑一起看，方向很一致：

AI 不再等你写 Prompt，它开始看你干活。

今天这篇文章，我就用最直白的方式带你玩一遍这两件新东西（GLM-5.2 上一篇文章已经讲透，这次不重复）。

一、uniTerm v1.0：6 月 18 日发布，把 Claude Code 装进终端

如果你跟服务器打过交道，应该熟悉这种痛苦：

排查问题要 SSH 上去敲命令，记不住参数
部署代码要 SFTP 拖文件，目录一深就迷路
查数据库要单独开客户端，连接信息还得记
服务器出问题想监控，又得装个 Zabbix、Prometheus

uniTerm 这个工具，想把上面所有事干完——并且内置了一个 AI Agent。

它是干嘛的

uniTerm 是基于 Wails v2 做的跨平台终端工具，原生支持 Windows、macOS、Linux。最大特点是终端里直接跑 AI Agent——你不需要打开 IDE、不需要写 Prompt，直接在终端里跟它说”帮我查这台服务器磁盘为什么满了”。

它兼容 Anthropic Messages API，所以 Claude、DeepSeek、Kimi、GLM 这些大模型都能接进去——不是绑定一家。

它都整合了哪些工具

老实讲，这工具的”全家桶”程度有点过分：

远程终端：SSH、Telnet、Mosh 全支持，带历史命令、文本高亮、Zmodem 文件传输
本地终端：PowerShell、CMD、Git Bash、zsh 都能跑
文件传输：SFTP、FTP、FTPS，带双栏文件管理，拖拽上传下载
远程桌面：Windows RDP（仅 Windows 客户端）、VNC、SPICE
数据库客户端：MySQL、PostgreSQL、rqlite 直接连，SQL 查询、数据行在线编辑、表/索引管理都支持；还能走 SSH 隧道跳板
服务器监控：CPU、内存、磁盘、网络、进程、端口、网卡实时监控

光看这一串功能，它就已经把 MobaXterm（Windows 上的 SSH 工具）、Navicat（数据库客户端）、FileZilla（FTP 工具）这些常见的运维工具合在一起了——一个 uniTerm 就够。

重点：AI Agent 不是噱头

uniTerm 的 AI 不是挂个聊天窗口那么简单：

自主多轮任务执行：你说一句”帮我看看磁盘为什么满了”，AI 自己拆解步骤：df -h 看分区、du -sh 看大文件、find 找大文件，然后给你结论
沉浸式协作：AI 命令直接在你当前终端标签里执行，分屏场景下人机同屏
四级权限管控：免确认 / 仅高危确认 / 写操作确认 / 全部确认——你可以自己选 AI 的”自由度”
会话持久化：AI 对话按会话保存，重启应用不丢历史

实操：3 步上手

第一步：下载安装

全平台安装包 5.9MB、内存占用不到 20MB——比装个 Electron 应用轻太多了。地址：https://github.com/ys-ll/uniterm/releases

Windows：uniterm-windows-amd64-installer-*.exe 安装包
macOS：uniterm-darwin-universal-*.dmg 镜像包，兼容 Intel 芯片与苹果芯片
Linux：uniterm-linux-amd64-*.tar.gz 压缩包

第二步：配置大模型

设置里找「AI 模型」，填兼容 Anthropic 协议的 API 地址——可以用：

智谱 GLM-5.2（免费、国产算力支持）
月之暗面 Kimi（便宜、中文好）
DeepSeek（性价比）
Anthropic Claude（贵但好用）

第三步：跟 AI 说话

点侧边栏 AI 图标，直接用自然语言提需求。

举个实际例子。假设你要排查一台服务器磁盘满了：

Bash

你：磁盘满了，帮我看看是哪些目录占的多
AI：让我先看一下整体情况
[执行 df -h]
[执行 du -sh /var/* 2>/dev/null | sort -hr | head -10]
AI：磁盘 95% 满，最大的是 /var/log 占了 80G，
    主要是 /var/log/journal 目录有 65G 的旧日志。
    要我清理掉 30 天前的 journal 日志吗？
你：清理吧
AI：[执行 journalctl --vacuum-time=30d]
[执行 df -h 确认]
AI：清理完成，磁盘使用降到 38%

你：磁盘满了，帮我看看是哪些目录占的多
AI：让我先看一下整体情况
[执行 df -h]
[执行 du -sh /var/* 2>/dev/null | sort -hr | head -10]
AI：磁盘 95% 满，最大的是 /var/log 占了 80G，
    主要是 /var/log/journal 目录有 65G 的旧日志。
    要我清理掉 30 天前的 journal 日志吗？
你：清理吧
AI：[执行 journalctl --vacuum-time=30d]
[执行 df -h 确认]
AI：清理完成，磁盘使用降到 38%

整个过程你只说了两句话。

它适合谁

日常跟服务器打交道的运维 / 后端
不想学 Kubernetes / Docker 但需要 AI 帮忙排错的小白
想要 Claude Code 体验但不喜欢 VSCode 的用户

一个小提醒：uniTerm 的”AI Agent”复刻的是 Claude Code 体验，但它本身不是 Claude Code——Claude Code 绑死在 Anthropic 协议上，uniTerm 通过兼容 Anthropic Messages API 让任何模型都能跑。换个角度说，你可以把 uniTerm 理解成”国产开源版 Claude Code 终端”，且能塞 GLM-5.2 / DeepSeek 这种便宜模型。

二、Codex Record & Replay：6 月 19 日发布，把”写 Prompt”变成”录一遍”

这是两件新东西里最让我眼前一亮的——因为它彻底改变了”教 AI 干活”的方式。

以前我们怎么让 AI 干活

写 Prompt。

你要让 AI 帮你报销、写个特定格式的 issue、拉一份周报，得把每一步、每个细节、每种情况都用文字写清楚。说不全、说得有歧义，AI 就跑偏。

更关键的是——很多流程你”会干”但”写不出来”。你每周都报销，每一步都熟练，但你让我把报销流程写成一段 Prompt 给你看，我还真不一定写得清楚。

Record & Replay 怎么解决这个问题

OpenAI 在 6 月 19 日的 Codex Thursday 放出的 Record & Replay，逻辑很直接：

你不用描述，直接在 Mac 上把活儿干一遍，Codex 在旁边看着，把你的操作录成一份能复用、能改的 Skill。

什么意思？举个实际例子。

假设你每周要做一次”销售报表下载”——

打开浏览器 → 登录后台 → 点报表模块 → 选日期 → 导出 Excel → 打开 Excel → 整理格式 → 发邮件

以前你得写一段 Prompt 给 AI：”请打开浏览器，登录 xxx 后台，导航到报表模块，选择最近一周的数据，导出为 Excel 格式，整理表头后通过邮件发送给 xxx”——写得累不累？而且经常出岔子。

现在你只需要自己把这套流程演示一遍。

Codex 在你操作的时候观察你点了什么、输入了什么、打开了什么窗口，最后给你生成一份 SKILL.md：

markdown

Markdown

<strong># 销售周报下载技能</strong>

<strong>## 何时使用</strong>
- 当用户要求"下载本周销售报表"或类似请求时
- 每周五下午自动触发（如配置）

<strong>## 需要的输入</strong>
- 目标周次（默认本周）

<strong>## 步骤</strong>
1. 打开 Chrome 浏览器，访问后台地址
2. 使用保存的凭据登录
3. 导航到"报表中心 > 销售报表"
4. 选择日期范围（默认本周一到本周日）
5. 点击"导出 Excel"
6. 打开下载的文件，整理表头格式
7. 通过邮件发送给预设收件人

<strong>## 验证</strong>
- 确认 Excel 文件已成功下载
- 确认邮件已发送
- 检查文件格式符合规范

<strong># 销售周报下载技能</strong>

<strong>## 何时使用</strong>
- 当用户要求"下载本周销售报表"或类似请求时
- 每周五下午自动触发（如配置）

<strong>## 需要的输入</strong>
- 目标周次（默认本周）

<strong>## 步骤</strong>
1. 打开 Chrome 浏览器，访问后台地址
2. 使用保存的凭据登录
3. 导航到"报表中心 > 销售报表"
4. 选择日期范围（默认本周一到本周日）
5. 点击"导出 Excel"
6. 打开下载的文件，整理表头格式
7. 通过邮件发送给预设收件人

<strong>## 验证</strong>
- 确认 Excel 文件已成功下载
- 确认邮件已发送
- 检查文件格式符合规范

下次你只需要在 Codex 里说”下载本周销售报表”，它就自己把整套流程跑完。

这个功能牛在哪里

我看完官方文档，最打动我的不是”自动化”，是三个降维打击：

1. 把”会写”变成”会做”

写 Prompt 有门槛，”会描述任务”需要把隐性知识显性化；而”演示一遍”几乎没门槛——你天天干的活儿，闭着眼都能做。

一个天天报销的运营，未必写得清楚报销 Prompt，但他报销的流程闭着眼都能走一遍。Record & Replay 把自动化的入口从”会写 Prompt”挪到了”会干活”。

2. 流程经验第一次可复制

一个老员工脑子里的”流程经验”——怎么提一个合规的报销、怎么发一条符合规范的视频——以前靠口口相传、靠新人自己摸。现在录一遍，变成一份能跑的 Skill，谁都能用、每次都一样。

这意味着企业里那些没被文档化的流程，第一次可以被原样复制。

3. 生成的 Skill 是可读的

老式录宏你知道的——录的是”在屏幕第 300 像素点一下”，UI 一变就废，而且是个黑盒出错你都不知道错哪。

Record & Replay 生成的 Skill 是结构化的 Markdown：什么时候用、要什么输入、怎么做、怎么验证。出错能定位，场景变了能调整——这是和传统 RPA 拉开差距的地方。

实操：怎么录一个 Skill

步骤按官方文档走：

开启 Computer Use：Codex 设置里把 computer_use 打开（首次要授权”辅助功能”和”截屏”权限）
开始录制：在 Codex 应用 Plugins 菜单点 “Record a skill”，给个上下文或直接用建议的提示
演示一遍：你在 Mac 上把这件活正常干一遍。Codex 观察你的操作和窗口内容
停止录制：从菜单栏、悬浮条，或直接说”录完了”
生成 Skill：Codex 把演示整理成 SKILL.md，不满意还能让它改
回放使用：以后触发这个 Skill，它就用 Computer Use + 浏览器操作 + 插件把它干完

整个录制过程 1-3 分钟。

几个现实的坑

我得泼盆冷水——现在就指望它接管所有重复工作，太早了：

一次演示抓不住所有分支：你录的是”顺利的那一遍”。真实流程里全是岔路：字段空着怎么办、弹验证码怎么办、网络超时怎么办——你演示时没遇到的，Skill 大概率也不知道。
Computer Use 点 UI 本身就脆：靠识别屏幕点按钮，页面改版、弹窗、加载慢一拍就可能点错位置。这是所有”操作界面”类 Agent 的通病。
门槛限制实打实：目前只支持 macOS；首发不含欧洲经济区、英国和瑞士；要先开启 Computer Use。

它和 Claude 那条线怎么比

熟悉这块的读者应该看出来了——”Skill”和”Computer Use”这两个词，Anthropic 那边早就在做。OpenClaw 的 Skills 我们之前也介绍过，Anthropic 的 Claude Skills、Computer Use 也都做了挺久。

Record & Replay 的差异化，在于它把”怎么教 Agent 新技能“从”写 Skill 文档 / 配工具”简化成了”录一遍“。这一步降门槛降得挺狠。

如果你的情况是：用 Mac、有大量固定重复的桌面/网页流程（报销、填表、拉报表），值得现在就录一个试试，正好是它的主场。如果流程分支多、异常多、出错代价高（碰钱、碰生产数据），先用低风险活儿试水，别一上来让它跑关键流程。

这三件事串起来看，AI 行业在变什么

把三件事放一起看（GLM-5.2 开源 + uniTerm 发布 + Record & Replay 上线），你会发现 2026 年 6 月中下旬的 AI 行业有个明确转向：

模型层（GLM-5.2）+ 工具层（uniTerm）+ 交互层（Record & Replay）——三个层面同时在降低门槛。

智谱在降低模型使用门槛：MIT 开源，国产算力能跑，普通人用得起
uniTerm 在降低工具切换门槛：SSH、FTP、数据库、远程桌面、AI Agent 装进一个 5.9MB 的小工具
OpenAI 在降低 Prompt 编写门槛：你不用描述给 AI 听，演示给它看就行

这三层降低门槛的意义在于——以前用 AI 是程序员和极客的专利，现在运营、行政、文员、客服都能用。

如果说去年是”AI 大模型元年”（模型比谁更大、跑分比谁更高），今年显然在转向”AI 落地元年”（怎么让 AI 真的替你把活干完、怎么让普通人也能用上）。

这是更值得关注的方向。

两个工具的快速对照表

工具	发布时间	协议	核心场景	上手难度	适合谁
uniTerm v1.0	6 月 18 日	Apache 2.0 开源	终端 AI Agent + 运维全家桶	低（图形界面）	运维、后端、想用 Claude Code 不想装 IDE 的
Codex Record & Replay	6 月 19 日	OpenAI 闭源	把流程录成可复用 Skill	低（录一遍就行）	运营、行政、有重复桌面流程的

如果你今天就要挑一个先试：

你跟服务器打交道 → 装 uniTerm，配置个 GLM-5.2 或 Kimi 的 API，让它帮你日常运维
你有一堆重复的桌面流程 → 录一个 Record & Replay Skill 感受下，录完你会回来感谢我
你是开发者 → 上一篇文章的 GLM-5.2 装进 Claude Code 或 Cursor 也能立省订阅费

一个有意思的细节：uniTerm 的 AI Agent 部分，本身就用了 Anthropic Messages API 协议——意味着你装个 uniTerm，再配一个 GLM-5.2 的 API key（智谱现在送 token），就能”用 GLM-5.2 的脑子，跑 Claude Code 风格的活”。这种”工具层 + 模型层”的解耦，正在变成 2026 年 AI 工具的标配。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我进行处理。

发表回复取消回复

Open Claw：让 AI 真正“动手”的智能体革命

零成本玩转OpenClaw：免费API接入与避坑指南

如何为OpenClaw AI角色设置独特的人设

PicShrink：一个专注于实用的图片压缩工具

2026年“Claw”家族全系工具大盘点