6月1日黄仁勋在台北GTC上喊出”Agentic AI is here”,6月2日纳德拉在旧金山Build大会上宣布”Windows as an Agent Platform”。
一个卖硬件的,一个做系统的,12小时之内,把同一个信号拍了两次:Agent不再是概念,是基础设施。
这跟之前所有”AI Agent元年”的论调都不一样。以前说Agent,说的是”AI能帮你干活了”;这次说的,是”Agent需要跑在什么东西上”——英伟达的回答是Vera Rubin芯片,微软的回答是Windows Shell。我之前写过一篇AI Agent安全隐患开发者指南,当时主要聊的是Agent的安全问题,现在看来,Agent的运行环境问题可能比安全问题更紧迫。
黄仁勋的牌面:Vera Rubin量产,RTX Spark下桌
这次GTC Taipei信息量巨大,但核心就两条线:
第一条线:Agent需要新芯片。
Vera Rubin架构正式量产。这是英伟达第一次把”Agentic AI”写进芯片定位——Vera CPU专门面向Agent工作负载优化,BlueField-4 STX提供芯片级安全的Agent存储处理。OpenAI、Anthropic、SpaceX成了首批客户。
这个信号比算力数字本身更值得关注。以前卖芯片是说”更快”,现在卖芯片是说”更适合Agent”。这就好比从卖发动机变成卖整套动力总成——不是参数升级,是产品定义变了。
黄仁勋自己说的很直接:”Every token is now a revenue unit。”每个token都是收入单元。Agent时代,算力不是成本中心,是利润中心。这跟我在7250亿美元算力黑洞那篇里分析的趋势一致——算力支出正在从”不计成本的建设期”转向”ROI驱动的运营期”,只是黄仁勋把它包装得更优雅了。
第二条线:英伟达要当PC厂商了。
RTX Spark,跟联发科合作设计、台积电3nm代工的ARM架构PC芯片,今年秋季上市。戴尔、联想等整机厂商直接采购完整SoC,走的就是苹果Apple Silicon的路——CPU+GPU+AI单元一颗芯片全包。
同时微软Surface和戴尔会成为首批搭载英伟达N1X级别ARM芯片的设备厂商,配合Windows 11 26H1。这是英伟达第一次以主力处理器身份进入PC市场。
这两条线放到一起看:英伟达在做的事情,是把”Agent运行”从云端拉到端侧。 Vera Rubin管云端,RTX Spark管终端,中间用NVLink和DSX平台串起来——一个完整的Agent基础设施栈。
纳德拉的底牌:操作系统不再是管文件的了
微软Build 2026的发布密度同样惊人,但最值得说的是一个架构层面的变化:
Windows Agent Framework。
Agent不再是跑在Windows上的应用,而是注册到系统里的服务。它出现在任务栏,接收日历和文件系统事件,用内置任务调度器安排后台任务,权限通过Intune管理。Defender可以检测不受管理的Agent。
这不是”AI助手”升级,这是操作系统的定义变了。纳德拉的原话:”未来的操作系统不是用来管理文件和窗口的,而是用来管理Agent和任务的。”
配套的还有三个关键发布:
- Agent Store——开发者85%分成,Adobe和Zoom已签约。Agent的分发方式跟App一样,一键安装、权限明确、IT可管理。
- Azure Agent Mesh——控制平面,联合管理本地Windows服务器、Windows 365 Cloud PC和Azure Arc边缘设备上的Agent执行,按延迟和GPU可用性自动路由,Q4正式发布。
- WSL 3——半虚拟化GPU/NPU访问,Linux AI工作负载在Windows上接近原生速度。Snapdragon X Elite 2和AMD Ryzen AI芯片在多Agent模拟中比x86快40%。
这三个东西加在一起,微软画的图很清楚:Agent在本地跑,不够就去云端跑,用同一套API,同一个开发工具链。
还有一个值得注意的细节:微软取消了大部分Claude Code企业授权,迁移到GitHub Copilot CLI。某团队月度Claude Code成本超50万美元是直接原因。44%的AI Token消耗用于修复AI代码中的漏洞——这笔账怎么算都不划算。微软CFO的原话:”AI支出必须与业务价值直接挂钩。”这跟AI编程三国杀里的判断一脉相承——编程AI的竞争已经从”谁更强”变成”谁更划算”。
两条线交叉的地方
黄仁勋和纳德拉同一天下注Agent,但路径不同:
| 英伟达 | 微软 | |
|---|---|---|
| 核心产品 | Vera Rubin + RTX Spark | Windows Agent Framework + Azure Agent Mesh |
| 商业模式 | 卖芯片(云端+端侧) | 卖平台(OS+云+分成) |
| 护城河 | 算力霸权+架构锁定 | 15亿Windows设备+M365生态 |
| 对开发者的承诺 | 更快的Agent推理 | 更简单的Agent开发+分发 |
但两人赌的是同一件事:Agent会成为计算的基本单位,就像当年的进程和线程。
这也意味着一件事——Agent的基础设施化,会复制移动互联网时代App的基础设施化路径。 当年苹果做App Store,谷歌做Play Store,操作系统从”管理文件”变成”管理App”。现在同样的逻辑在重演,只是主角从App变成了Agent。
对开发者来说,这个信号很明确:不要只想着用Agent,要想怎么造Agent、卖Agent。Agent Store给85%分成,比App Store的70%慷慨——微软在抢开发者,这个窗口期不会太长。
被这两场发布会挤到角落里的人
MiniMax在6月1日发了M3,编程能力超过GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7,还有1M上下文和原生多模态。同天启动科创板IPO辅导,中信证券保荐。之前六小虎战略迫降那篇刚写过MiniMax的转型,没想到IPO+新旗舰同天砸下来。
放在任何一个普通周末,这都够上头条。但6月1日不是普通周末——黄仁勋和纳德拉几乎同时把聚光灯抢走了。
不过M3有一个细节特别值得说:它的FP8矩阵乘优化任务,运行24小时、147次提交、1959次工具调用,把Hopper硬件峰值利用率从7.6%提到71.3%,实现9.4倍加速。其他模型大多在前30次提交就放弃了,M3最优解出现在第145次。
这个数字比benchmark排名更有说服力。 真实工程场景里的坚持能力,比跑分更能说明一个模型的Agent水平。这也是为什么Agent基础设施化的前提——不是模型够强就行,是模型够”轴”才行,得能在一件事上反复试、不放弃。
美国的另一张牌:封堵芯片漏洞
5月31日,美国BIS发布新指引,封堵了一个存在一年的监管漏洞:中国企业的海外子公司不再能作为绕道采购先进AI芯片的路径。英伟达Rubin、Blackwell和AMD MI350X都在管制范围内,审查政策是”推定拒绝”——许可证基本不可能获批。
时间点耐人寻味:黄仁勋在台北喊”Agentic AI”的当天,美国政府在华盛顿封堵了Agent算力的另一条通道。
英伟达2027财年Q1对中国数据中心Hopper芯片已经零出货(去年同期46亿美元),但总营收靠Blackwell 300创下752亿美元新高。中国市场正在被替代,而不是被放弃。
国内这边,发改委已经召开发布会指导国产大模型加大适配国产算力芯片,DeepSeek-V4-Pro在昇腾910C上跑通1.6万亿参数训练证明了技术可行性。但高端芯片制造环节的瓶颈还在,这不是短期能解决的。中国大模型调用量连续碾压美国的背后,算力供给的脆弱性是那头房间里的大象。
底线
6月1-2日这48小时,AI行业同时收到了三个信号:
- Agent需要专属硬件(Vera Rubin)
- 操作系统要为Agent重写(Windows Agent Framework)
- Agent的算力通道被人为收紧(BIS新规)
前两个信号指向同一个未来——Agent就是下一代的App。第三个信号提醒你,这个未来不是均匀分布的。
对开发者的建议:别光盯着模型能力了。Agent Store 85%分成的窗口期、Windows Agent SDK的先发优势、WSL 3带来的端侧推理能力——这些才是接下来6个月真正值得投入的东西。
模型会越来越便宜,但Agent的分发渠道和运行环境,现在正在定型。
信息来源:英伟达GTC Taipei 2026主题演讲(6月1日)、新浪财经/财联社6月1日报道、Microsoft Build 2026主题演讲(6月2日)、智东西6月1日MiniMax M3报道、美国BIS 5月31日出口管制指引、电子工程专辑6月1日报道




发表回复