黄仁勋卖芯片给Agent，纳德拉让Windows变成Agent：同一天，两个人，同一个赌注

6月1日黄仁勋在台北GTC上喊出”Agentic AI is here”，6月2日纳德拉在旧金山Build大会上宣布”Windows as an Agent Platform”。

一个卖硬件的，一个做系统的，12小时之内，把同一个信号拍了两次：Agent不再是概念，是基础设施。

这跟之前所有”AI Agent元年”的论调都不一样。以前说Agent，说的是”AI能帮你干活了”；这次说的，是”Agent需要跑在什么东西上”——英伟达的回答是Vera Rubin芯片，微软的回答是Windows Shell。我之前写过一篇AI Agent安全隐患开发者指南，当时主要聊的是Agent的安全问题，现在看来，Agent的运行环境问题可能比安全问题更紧迫。

黄仁勋的牌面：Vera Rubin量产，RTX Spark下桌

这次GTC Taipei信息量巨大，但核心就两条线：

第一条线：Agent需要新芯片。

Vera Rubin架构正式量产。这是英伟达第一次把”Agentic AI”写进芯片定位——Vera CPU专门面向Agent工作负载优化，BlueField-4 STX提供芯片级安全的Agent存储处理。OpenAI、Anthropic、SpaceX成了首批客户。

这个信号比算力数字本身更值得关注。以前卖芯片是说”更快”，现在卖芯片是说”更适合Agent”。这就好比从卖发动机变成卖整套动力总成——不是参数升级，是产品定义变了。

黄仁勋自己说的很直接：”Every token is now a revenue unit。”每个token都是收入单元。Agent时代，算力不是成本中心，是利润中心。这跟我在7250亿美元算力黑洞那篇里分析的趋势一致——算力支出正在从”不计成本的建设期”转向”ROI驱动的运营期”，只是黄仁勋把它包装得更优雅了。

第二条线：英伟达要当PC厂商了。

RTX Spark，跟联发科合作设计、台积电3nm代工的ARM架构PC芯片，今年秋季上市。戴尔、联想等整机厂商直接采购完整SoC，走的就是苹果Apple Silicon的路——CPU+GPU+AI单元一颗芯片全包。

同时微软Surface和戴尔会成为首批搭载英伟达N1X级别ARM芯片的设备厂商，配合Windows 11 26H1。这是英伟达第一次以主力处理器身份进入PC市场。

这两条线放到一起看：英伟达在做的事情，是把”Agent运行”从云端拉到端侧。 Vera Rubin管云端，RTX Spark管终端，中间用NVLink和DSX平台串起来——一个完整的Agent基础设施栈。

纳德拉的底牌：操作系统不再是管文件的了

微软Build 2026的发布密度同样惊人，但最值得说的是一个架构层面的变化：

Windows Agent Framework。

Agent不再是跑在Windows上的应用，而是注册到系统里的服务。它出现在任务栏，接收日历和文件系统事件，用内置任务调度器安排后台任务，权限通过Intune管理。Defender可以检测不受管理的Agent。

这不是”AI助手”升级，这是操作系统的定义变了。纳德拉的原话：”未来的操作系统不是用来管理文件和窗口的，而是用来管理Agent和任务的。”

配套的还有三个关键发布：

Agent Store——开发者85%分成，Adobe和Zoom已签约。Agent的分发方式跟App一样，一键安装、权限明确、IT可管理。
Azure Agent Mesh——控制平面，联合管理本地Windows服务器、Windows 365 Cloud PC和Azure Arc边缘设备上的Agent执行，按延迟和GPU可用性自动路由，Q4正式发布。
WSL 3——半虚拟化GPU/NPU访问，Linux AI工作负载在Windows上接近原生速度。Snapdragon X Elite 2和AMD Ryzen AI芯片在多Agent模拟中比x86快40%。

这三个东西加在一起，微软画的图很清楚：Agent在本地跑，不够就去云端跑，用同一套API，同一个开发工具链。

还有一个值得注意的细节：微软取消了大部分Claude Code企业授权，迁移到GitHub Copilot CLI。某团队月度Claude Code成本超50万美元是直接原因。44%的AI Token消耗用于修复AI代码中的漏洞——这笔账怎么算都不划算。微软CFO的原话：”AI支出必须与业务价值直接挂钩。”这跟AI编程三国杀里的判断一脉相承——编程AI的竞争已经从”谁更强”变成”谁更划算”。

两条线交叉的地方

黄仁勋和纳德拉同一天下注Agent，但路径不同：

	英伟达	微软
核心产品	Vera Rubin + RTX Spark	Windows Agent Framework + Azure Agent Mesh
商业模式	卖芯片（云端+端侧）	卖平台（OS+云+分成）
护城河	算力霸权+架构锁定	15亿Windows设备+M365生态
对开发者的承诺	更快的Agent推理	更简单的Agent开发+分发

但两人赌的是同一件事：Agent会成为计算的基本单位，就像当年的进程和线程。

这也意味着一件事——Agent的基础设施化，会复制移动互联网时代App的基础设施化路径。 当年苹果做App Store，谷歌做Play Store，操作系统从”管理文件”变成”管理App”。现在同样的逻辑在重演，只是主角从App变成了Agent。

对开发者来说，这个信号很明确：不要只想着用Agent，要想怎么造Agent、卖Agent。Agent Store给85%分成，比App Store的70%慷慨——微软在抢开发者，这个窗口期不会太长。

被这两场发布会挤到角落里的人

MiniMax在6月1日发了M3，编程能力超过GPT-5.5和Gemini 3.1 Pro，接近Claude Opus 4.7，还有1M上下文和原生多模态。同天启动科创板IPO辅导，中信证券保荐。之前六小虎战略迫降那篇刚写过MiniMax的转型，没想到IPO+新旗舰同天砸下来。

放在任何一个普通周末，这都够上头条。但6月1日不是普通周末——黄仁勋和纳德拉几乎同时把聚光灯抢走了。

不过M3有一个细节特别值得说：它的FP8矩阵乘优化任务，运行24小时、147次提交、1959次工具调用，把Hopper硬件峰值利用率从7.6%提到71.3%，实现9.4倍加速。其他模型大多在前30次提交就放弃了，M3最优解出现在第145次。

这个数字比benchmark排名更有说服力。 真实工程场景里的坚持能力，比跑分更能说明一个模型的Agent水平。这也是为什么Agent基础设施化的前提——不是模型够强就行，是模型够”轴”才行，得能在一件事上反复试、不放弃。

美国的另一张牌：封堵芯片漏洞

5月31日，美国BIS发布新指引，封堵了一个存在一年的监管漏洞：中国企业的海外子公司不再能作为绕道采购先进AI芯片的路径。英伟达Rubin、Blackwell和AMD MI350X都在管制范围内，审查政策是”推定拒绝”——许可证基本不可能获批。

时间点耐人寻味：黄仁勋在台北喊”Agentic AI”的当天，美国政府在华盛顿封堵了Agent算力的另一条通道。

英伟达2027财年Q1对中国数据中心Hopper芯片已经零出货（去年同期46亿美元），但总营收靠Blackwell 300创下752亿美元新高。中国市场正在被替代，而不是被放弃。

国内这边，发改委已经召开发布会指导国产大模型加大适配国产算力芯片，DeepSeek-V4-Pro在昇腾910C上跑通1.6万亿参数训练证明了技术可行性。但高端芯片制造环节的瓶颈还在，这不是短期能解决的。中国大模型调用量连续碾压美国的背后，算力供给的脆弱性是那头房间里的大象。

底线

6月1-2日这48小时，AI行业同时收到了三个信号：

Agent需要专属硬件（Vera Rubin）
操作系统要为Agent重写（Windows Agent Framework）
Agent的算力通道被人为收紧（BIS新规）

前两个信号指向同一个未来——Agent就是下一代的App。第三个信号提醒你，这个未来不是均匀分布的。

对开发者的建议：别光盯着模型能力了。Agent Store 85%分成的窗口期、Windows Agent SDK的先发优势、WSL 3带来的端侧推理能力——这些才是接下来6个月真正值得投入的东西。

模型会越来越便宜，但Agent的分发渠道和运行环境，现在正在定型。

信息来源：英伟达GTC Taipei 2026主题演讲（6月1日）、新浪财经/财联社6月1日报道、Microsoft Build 2026主题演讲（6月2日）、智东西6月1日MiniMax M3报道、美国BIS 5月31日出口管制指引、电子工程专辑6月1日报道

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我进行处理。

发表回复取消回复

Open Claw：让 AI 真正“动手”的智能体革命

零成本玩转OpenClaw：免费API接入与避坑指南

如何为OpenClaw AI角色设置独特的人设

PicShrink：一个专注于实用的图片压缩工具

2026年“Claw”家族全系工具大盘点

微软Polaris踢走GPT-4、阿里Qwen3.7-Plus杀入Agent赛道：AI巨头全面“去依赖化”