如果你最近在用 AI 工具,可能有一个感受:模型越来越聪明,但真正帮你把活干完还是费劲。
写 Prompt 写到抓狂,结果 AI 给的答案跟你想要的差十万八千里——这其实是过去两年用大模型干活的主旋律。你描述任务,模型理解任务,中间这一道”翻译”天然有损耗。
但 6 月 17 日到 19 日这三天,两件东西同时冒出来,把”自动化”这件事的门槛狠狠往下踩了一脚——而且都跟”不再写 Prompt”有关。
- 6 月 18 日,国产 uniTerm v1.0 正式发布(Apache 2.0 协议),把”Claude Code 级别”的 AI Agent 嵌进了终端——你不用打开 IDE、不用写 Prompt,直接在终端里跟它说”帮我看看这台服务器上为什么磁盘满了”。
- 6 月 19 日,OpenAI 在 Codex Thursday 上线 Record & Replay:你在 Mac 上把活儿演示一遍,Codex 直接把你这次操作录成一份能复用、能改的 Skill——以后这活儿它自己干,连 Prompt 都不用写。
再加上 6 月 17 日正式开源的智谱 GLM-5.2(我们在6 月 15 日那篇文章详细分析过),三件事凑一起看,方向很一致:
AI 不再等你写 Prompt,它开始看你干活。
今天这篇文章,我就用最直白的方式带你玩一遍这两件新东西(GLM-5.2 上一篇文章已经讲透,这次不重复)。
一、uniTerm v1.0:6 月 18 日发布,把 Claude Code 装进终端
如果你跟服务器打过交道,应该熟悉这种痛苦:
- 排查问题要 SSH 上去敲命令,记不住参数
- 部署代码要 SFTP 拖文件,目录一深就迷路
- 查数据库要单独开客户端,连接信息还得记
- 服务器出问题想监控,又得装个 Zabbix、Prometheus
uniTerm 这个工具,想把上面所有事干完——并且内置了一个 AI Agent。
它是干嘛的
uniTerm 是基于 Wails v2 做的跨平台终端工具,原生支持 Windows、macOS、Linux。最大特点是终端里直接跑 AI Agent——你不需要打开 IDE、不需要写 Prompt,直接在终端里跟它说”帮我查这台服务器磁盘为什么满了”。
它兼容 Anthropic Messages API,所以 Claude、DeepSeek、Kimi、GLM 这些大模型都能接进去——不是绑定一家。
它都整合了哪些工具
老实讲,这工具的”全家桶”程度有点过分:
- 远程终端:SSH、Telnet、Mosh 全支持,带历史命令、文本高亮、Zmodem 文件传输
- 本地终端:PowerShell、CMD、Git Bash、zsh 都能跑
- 文件传输:SFTP、FTP、FTPS,带双栏文件管理,拖拽上传下载
- 远程桌面:Windows RDP(仅 Windows 客户端)、VNC、SPICE
- 数据库客户端:MySQL、PostgreSQL、rqlite 直接连,SQL 查询、数据行在线编辑、表/索引管理都支持;还能走 SSH 隧道跳板
- 服务器监控:CPU、内存、磁盘、网络、进程、端口、网卡实时监控
光看这一串功能,它就已经把 MobaXterm(Windows 上的 SSH 工具)、Navicat(数据库客户端)、FileZilla(FTP 工具)这些常见的运维工具合在一起了——一个 uniTerm 就够。
重点:AI Agent 不是噱头
uniTerm 的 AI 不是挂个聊天窗口那么简单:
- 自主多轮任务执行:你说一句”帮我看看磁盘为什么满了”,AI 自己拆解步骤:df -h 看分区、du -sh 看大文件、find 找大文件,然后给你结论
- 沉浸式协作:AI 命令直接在你当前终端标签里执行,分屏场景下人机同屏
- 四级权限管控:免确认 / 仅高危确认 / 写操作确认 / 全部确认——你可以自己选 AI 的”自由度”
- 会话持久化:AI 对话按会话保存,重启应用不丢历史
实操:3 步上手
第一步:下载安装
全平台安装包 5.9MB、内存占用不到 20MB——比装个 Electron 应用轻太多了。地址:https://github.com/ys-ll/uniterm/releases
- Windows:
uniterm-windows-amd64-installer-*.exe安装包 - macOS:
uniterm-darwin-universal-*.dmg镜像包,兼容 Intel 芯片与苹果芯片 - Linux:
uniterm-linux-amd64-*.tar.gz压缩包
第二步:配置大模型
设置里找「AI 模型」,填兼容 Anthropic 协议的 API 地址——可以用:
- 智谱 GLM-5.2(免费、国产算力支持)
- 月之暗面 Kimi(便宜、中文好)
- DeepSeek(性价比)
- Anthropic Claude(贵但好用)
第三步:跟 AI 说话
点侧边栏 AI 图标,直接用自然语言提需求。
举个实际例子。假设你要排查一台服务器磁盘满了:
你:磁盘满了,帮我看看是哪些目录占的多
AI:让我先看一下整体情况
[执行 df -h]
[执行 du -sh /var/* 2>/dev/null | sort -hr | head -10]
AI:磁盘 95% 满,最大的是 /var/log 占了 80G,
主要是 /var/log/journal 目录有 65G 的旧日志。
要我清理掉 30 天前的 journal 日志吗?
你:清理吧
AI:[执行 journalctl --vacuum-time=30d]
[执行 df -h 确认]
AI:清理完成,磁盘使用降到 38%
整个过程你只说了两句话。
它适合谁
- 日常跟服务器打交道的运维 / 后端
- 不想学 Kubernetes / Docker 但需要 AI 帮忙排错的小白
- 想要 Claude Code 体验但不喜欢 VSCode 的用户
一个小提醒:uniTerm 的”AI Agent”复刻的是 Claude Code 体验,但它本身不是 Claude Code——Claude Code 绑死在 Anthropic 协议上,uniTerm 通过兼容 Anthropic Messages API 让任何模型都能跑。换个角度说,你可以把 uniTerm 理解成”国产开源版 Claude Code 终端”,且能塞 GLM-5.2 / DeepSeek 这种便宜模型。
二、Codex Record & Replay:6 月 19 日发布,把”写 Prompt”变成”录一遍”
这是两件新东西里最让我眼前一亮的——因为它彻底改变了”教 AI 干活”的方式。
以前我们怎么让 AI 干活
写 Prompt。
你要让 AI 帮你报销、写个特定格式的 issue、拉一份周报,得把每一步、每个细节、每种情况都用文字写清楚。说不全、说得有歧义,AI 就跑偏。
更关键的是——很多流程你”会干”但”写不出来”。你每周都报销,每一步都熟练,但你让我把报销流程写成一段 Prompt 给你看,我还真不一定写得清楚。
Record & Replay 怎么解决这个问题
OpenAI 在 6 月 19 日的 Codex Thursday 放出的 Record & Replay,逻辑很直接:
你不用描述,直接在 Mac 上把活儿干一遍,Codex 在旁边看着,把你的操作录成一份能复用、能改的 Skill。
什么意思?举个实际例子。
假设你每周要做一次”销售报表下载”——
打开浏览器 → 登录后台 → 点报表模块 → 选日期 → 导出 Excel → 打开 Excel → 整理格式 → 发邮件
以前你得写一段 Prompt 给 AI:”请打开浏览器,登录 xxx 后台,导航到报表模块,选择最近一周的数据,导出为 Excel 格式,整理表头后通过邮件发送给 xxx”——写得累不累?而且经常出岔子。
现在你只需要自己把这套流程演示一遍。
Codex 在你操作的时候观察你点了什么、输入了什么、打开了什么窗口,最后给你生成一份 SKILL.md:
markdown
<strong># 销售周报下载技能</strong>
<strong>## 何时使用</strong>
- 当用户要求"下载本周销售报表"或类似请求时
- 每周五下午自动触发(如配置)
<strong>## 需要的输入</strong>
- 目标周次(默认本周)
<strong>## 步骤</strong>
1. 打开 Chrome 浏览器,访问后台地址
2. 使用保存的凭据登录
3. 导航到"报表中心 > 销售报表"
4. 选择日期范围(默认本周一到本周日)
5. 点击"导出 Excel"
6. 打开下载的文件,整理表头格式
7. 通过邮件发送给预设收件人
<strong>## 验证</strong>
- 确认 Excel 文件已成功下载
- 确认邮件已发送
- 检查文件格式符合规范
下次你只需要在 Codex 里说”下载本周销售报表”,它就自己把整套流程跑完。
这个功能牛在哪里
我看完官方文档,最打动我的不是”自动化”,是三个降维打击:
1. 把”会写”变成”会做”
写 Prompt 有门槛,”会描述任务”需要把隐性知识显性化;而”演示一遍”几乎没门槛——你天天干的活儿,闭着眼都能做。
一个天天报销的运营,未必写得清楚报销 Prompt,但他报销的流程闭着眼都能走一遍。Record & Replay 把自动化的入口从”会写 Prompt”挪到了”会干活”。
2. 流程经验第一次可复制
一个老员工脑子里的”流程经验”——怎么提一个合规的报销、怎么发一条符合规范的视频——以前靠口口相传、靠新人自己摸。现在录一遍,变成一份能跑的 Skill,谁都能用、每次都一样。
这意味着企业里那些没被文档化的流程,第一次可以被原样复制。
3. 生成的 Skill 是可读的
老式录宏你知道的——录的是”在屏幕第 300 像素点一下”,UI 一变就废,而且是个黑盒出错你都不知道错哪。
Record & Replay 生成的 Skill 是结构化的 Markdown:什么时候用、要什么输入、怎么做、怎么验证。出错能定位,场景变了能调整——这是和传统 RPA 拉开差距的地方。
实操:怎么录一个 Skill
步骤按官方文档走:
- 开启 Computer Use:Codex 设置里把
computer_use打开(首次要授权”辅助功能”和”截屏”权限) - 开始录制:在 Codex 应用 Plugins 菜单点 “Record a skill”,给个上下文或直接用建议的提示
- 演示一遍:你在 Mac 上把这件活正常干一遍。Codex 观察你的操作和窗口内容
- 停止录制:从菜单栏、悬浮条,或直接说”录完了”
- 生成 Skill:Codex 把演示整理成
SKILL.md,不满意还能让它改 - 回放使用:以后触发这个 Skill,它就用 Computer Use + 浏览器操作 + 插件 把它干完
整个录制过程 1-3 分钟。
几个现实的坑
我得泼盆冷水——现在就指望它接管所有重复工作,太早了:
- 一次演示抓不住所有分支:你录的是”顺利的那一遍”。真实流程里全是岔路:字段空着怎么办、弹验证码怎么办、网络超时怎么办——你演示时没遇到的,Skill 大概率也不知道。
- Computer Use 点 UI 本身就脆:靠识别屏幕点按钮,页面改版、弹窗、加载慢一拍就可能点错位置。这是所有”操作界面”类 Agent 的通病。
- 门槛限制实打实:目前只支持 macOS;首发不含欧洲经济区、英国和瑞士;要先开启 Computer Use。
它和 Claude 那条线怎么比
熟悉这块的读者应该看出来了——”Skill”和”Computer Use”这两个词,Anthropic 那边早就在做。OpenClaw 的 Skills 我们之前也介绍过,Anthropic 的 Claude Skills、Computer Use 也都做了挺久。
Record & Replay 的差异化,在于它把”怎么教 Agent 新技能“从”写 Skill 文档 / 配工具”简化成了”录一遍“。这一步降门槛降得挺狠。
如果你的情况是:用 Mac、有大量固定重复的桌面/网页流程(报销、填表、拉报表),值得现在就录一个试试,正好是它的主场。如果流程分支多、异常多、出错代价高(碰钱、碰生产数据),先用低风险活儿试水,别一上来让它跑关键流程。
这三件事串起来看,AI 行业在变什么
把三件事放一起看(GLM-5.2 开源 + uniTerm 发布 + Record & Replay 上线),你会发现 2026 年 6 月中下旬的 AI 行业有个明确转向:
模型层(GLM-5.2)+ 工具层(uniTerm)+ 交互层(Record & Replay)——三个层面同时在降低门槛。
- 智谱在降低模型使用门槛:MIT 开源,国产算力能跑,普通人用得起
- uniTerm 在降低工具切换门槛:SSH、FTP、数据库、远程桌面、AI Agent 装进一个 5.9MB 的小工具
- OpenAI 在降低 Prompt 编写门槛:你不用描述给 AI 听,演示给它看就行
这三层降低门槛的意义在于——以前用 AI 是程序员和极客的专利,现在运营、行政、文员、客服都能用。
如果说去年是”AI 大模型元年”(模型比谁更大、跑分比谁更高),今年显然在转向”AI 落地元年”(怎么让 AI 真的替你把活干完、怎么让普通人也能用上)。
这是更值得关注的方向。
两个工具的快速对照表
| 工具 | 发布时间 | 协议 | 核心场景 | 上手难度 | 适合谁 |
|---|---|---|---|---|---|
| uniTerm v1.0 | 6 月 18 日 | Apache 2.0 开源 | 终端 AI Agent + 运维全家桶 | 低(图形界面) | 运维、后端、想用 Claude Code 不想装 IDE 的 |
| Codex Record & Replay | 6 月 19 日 | OpenAI 闭源 | 把流程录成可复用 Skill | 低(录一遍就行) | 运营、行政、有重复桌面流程的 |
如果你今天就要挑一个先试:
- 你跟服务器打交道 → 装 uniTerm,配置个 GLM-5.2 或 Kimi 的 API,让它帮你日常运维
- 你有一堆重复的桌面流程 → 录一个 Record & Replay Skill 感受下,录完你会回来感谢我
- 你是开发者 → 上一篇文章的 GLM-5.2 装进 Claude Code 或 Cursor 也能立省订阅费
一个有意思的细节:uniTerm 的 AI Agent 部分,本身就用了 Anthropic Messages API 协议——意味着你装个 uniTerm,再配一个 GLM-5.2 的 API key(智谱现在送 token),就能”用 GLM-5.2 的脑子,跑 Claude Code 风格的活”。这种”工具层 + 模型层”的解耦,正在变成 2026 年 AI 工具的标配。




发表回复