造 Transformer 的人去了 OpenAI,拿诺奖的去了 Anthropic——你用的 AI 工具该换吗?

6 月 18 日,Noam Shazeer 在 X 上发了一条告别帖:”很高兴分享我将加入 OpenAI,期待与那里卓越的团队共事。这是一个艰难的决定。”措辞克制,但信息量炸裂——Shazeer 不是普通工程师,他是 Transformer 架构的核心发明者、Google Gemini 的联合负责人、2024 年 Google 花 27 亿美元请回来的人。

第二天,John Jumper 也宣布了离开。他在 Google DeepMind 工作了近 9 年,是 AlphaFold 的核心领导者,2024 年拿了诺贝尔化学奖。他的去向是 Anthropic。

24 小时,Google 丢了两个人。一个发明了支撑所有 AI 运行的底层架构,一个用 AI 解决了困扰科学界 50 年的蛋白质折叠难题。这不是普通的人事变动,这是 AI 行业的人才地震。

这两个人到底有多重要?

先说 Shazeer。

2017 年那篇《Attention Is All You Need》,几乎所有做大模型的人都知道。Shazeer 不仅是论文作者之一,他亲手设计了多头注意力机制和残差连接,还完成了第一个超越当时最优水平的 Transformer 实现。后来的 MoE(稀疏门控混合专家)架构也是他 2016 年提出的——你现在用的 GPT、Claude、Gemini 全是 MoE 架构在撑着,省算力的核心方案就是他发明的。Mesh-TensorFlow、LaMDA、T5,他的贡献清单拉出来,现代大模型的底层技术几乎都跟他有关。

更戏剧性的是他的出走回归再出走。2021 年他离开 Google 创了 Character.AI,2024 年 Google 花 27 亿美元的技术许可协议把他请回来,他个人套现估计 7.5 到 10 亿美元。回归后据说他发现 Gemini 训练里一个隐藏漏洞,大幅提升了训练效率,让 Gemini 3 登顶各大榜单——OpenAI 内部据说拉了”红色警报”。结果一年后,他又走了。

Shazeer 在 OpenAI 的新职位是”架构研究负责人”。注意措辞——不是优化现有产品,是探索 Transformer 之后的技术。OpenAI 现在已经集齐两位 Transformer 论文作者:Lukasz Kaiser 五年前就加入了,主导了 o1 和 o3 推理模型的核心研发。两位奠基人在同一家公司合作搭建下一代架构,这在行业里是独一份的组合。

再说 Jumper。

AlphaFold 2 解决了蛋白质折叠这个 50 年未解的科学难题,影响的是整个生物医学领域。2024 年诺贝尔化学奖颁给 Jumper 和 Demis Hassabis,不是因为他们做了”一个 AI 工具”,是因为他们用 AI 解决了一个人类用传统方法根本解决不了的问题。

Jumper 选择 Anthropic 的信号意义很明确:Anthropic 不再只是一个做聊天 AI + 写安全报告的公司。Claude Fable 5 上个月刚展示了蛋白设计提速 10 倍的能力,Anthropic 发布 Fable 5 的同一天 OpenAI 递交了 IPO 招股书——当时我就说这是”两个禁区同时破了”。现在 Jumper 的加入,让 Anthropic 在科学 AI 方向有了真正的领军人物。

Google 被掏了什么?

Shazeer 是 Gemini 联合负责人。Gemini 是 Google 在 AI 领域的全部赌注——今年 Google I/O 上 Pichai 亲自宣布 Gemini 月活 9 亿,靠的就是 9 亿用户基数和 Workspace 生态(Gmail、Docs、Sheets 全线接入)。但月活用户不等于技术领先。Gemini 的技术灵魂走了。

Jumper 的离开对 Google DeepMind 的打击更深远。DeepMind 的品牌价值很大程度建立在 AlphaFold 上——这是 Google AI 做出的最具社会影响力的成果,也是让全世界相信”Google 的 AI 不是只会聊天”的活招牌。招牌走了。

27 亿没留住 Shazeer,诺贝尔奖也没留住 Jumper。钱和荣誉都不是留住顶级人才的筹码,看来真正吸引这些人的是”下一步做什么”。

对你的 AI 工具意味着什么?

这才是重点。人才迁移离你很远,但工具变化离你很近。

如果你在用 ChatGPT

Shazeer 加入 OpenAI 后负责”架构研究”,探索的是 Transformer 之后的技术。这意味着 OpenAI 的下一代模型架构可能会有根本性变化——不是 GPT-6 比 GPT-5.5 参数多一点的那种迭代,是底层结构换赛道。

但别急着兴奋。架构研究到产品落地通常需要 12-18 个月。Shazeer 的”下一代架构”大概率 2027 年才会在 ChatGPT 里体现。你现在能感受到的改进,更多来自 Kaiser 主导的推理模型路线——o3 系列刚上线了计划任务功能,推理深度正在持续提升。

短期建议:ChatGPT 在推理分析、深度研究方面会继续领先,适合做需要”想好几步”的任务——数学推导、逻辑分析、复杂代码审查。Shazeer 的加入是中长期利好,短期不用改用法。

如果你在用 Claude

Jumper 加入 Anthropic 是一个方向信号:科学推理会成为 Claude 的下一个重点。这跟 Anthropic 既有路线是吻合的——Anthropic 自己说内部 80% 的代码由 Claude 写,Fable 5 的蛋白设计能力已经证明 Claude 在科学领域不只是”能聊天”。Jumper 来了之后,Claude 在理解复杂科学问题、辅助科研、处理多步推理方面的能力大概率会增强。

但同样,别急着下结论。Jumper 要先”短暂休整”再加入 Anthropic,他擅长的领域(蛋白质结构预测)和 Claude 当前主打的方向(编程、对话、安全)有一定距离,融合需要时间。

短期建议:Claude 在编程辅助和长文本处理方面依然是最好的选择之一,尤其是 Claude Code。AI 实战应用指南里我们测过的 10 个场景,编程场景 Claude 的完成率最高。Jumper 的加入会在中长期增强科学推理方向,如果你是科研工作者,值得长期关注 Claude。

如果你在用 Gemini

Google 丢了两个最值钱的人,但 Gemini 的工具生态并没有停——上周刚推送了 Gemini Live 记忆功能升级(可以记住你之前说过的话,对话不再每次从零开始),Gemini 也全面进入了 Google Sheets(在表格里直接问 AI 分析数据)。

Gemini 的优势从来不是”模型最强”,是”工具最方便”。9 亿月活用户、Gmail/Docs/Sheets/YouTube 全线接入、$20/月的 AI Premium 订阅覆盖全家桶——这种便利性是 ChatGPT 和 Claude 都做不到的。

但底层模型的技术领导力出现了真空。Shazeer 走了之后,Gemini 的技术方向谁来定?Google 的 AI 人才储备确实雄厚,但 Shazeer 是那个”发现了训练漏洞就能逼 OpenAI 拉红色警报”的人,这种级别的洞察力不是换个人就能补上的。

短期建议:Gemini 在日常办公场景(写邮件、整理表格、搜索增强)依然是最顺手的选择。但如果你在乎推理深度和编程能力,建议把 Gemini 当日常工具而不是主力工具。

三个踩坑提醒

1. 不要因为人才新闻就急着换工具。

技术突破到产品落地有时间差。Shazeer 的架构研究最早 2027 年才会体现在 ChatGPT 里,Jumper 的科学推理方向融合需要时间。现在各家工具的能力格局跟上周没变化,该用什么还用什么。

2. Gemini Live 记忆功能有区域限制。

目前只在美国英语用户开放,中国用户暂时用不到。Gemini Sheets 需要 $20/月的 AI Premium 订阅,免费用户只能看不能摸。之前写过 AI 工具的成本账单问题,Google 的全家桶定价算是中等水平,但如果你只是偶尔用 Sheets 里的 AI,$20/月不一定划算。

3. 中国用户的实际情况。

Gemini 在中国没有备案,访问受限。Claude 也没有正式落地中国。ChatGPT 去年完成了备案,是目前三大工具中唯一在中国正式可用的。如果你在中国大陆日常使用 AI,ChatGPT 的可用性是最高的——人才新闻很刺激,但能用才是第一前提。

我的判断

AI 行业最激烈的竞争不是模型榜单排名,是人才争夺。造 Transformer 的人选择 OpenAI,拿诺贝尔奖的人选择 Anthropic,Google 花 27 亿也留不住人——这说明一件事:AI 的下一个突破不取决于谁有最多用户,取决于谁能让最厉害的人做最想做的事。

对普通用户来说,好消息是三家都在拼命把最好的技术变成最好用的工具。OpenAI 用推理模型拉高 ChatGPT 的智商,Anthropic 用编程和安全能力深耕 Claude 的专业场景,Google 用 Workspace 生态让 Gemini 成为最方便的日常助手。AI Agent 的安全隐患我们之前聊过,但别忘了,这些工具也在以从未有过的速度变好。

你不需要急着换工具,但你应该知道——这些工具背后的技术正在换赛道。 Transformer 之后的架构会来,科学推理会成为 AI 的新战场。等变化落到产品里的时候,你至少得知道该往哪看。


信息来源:The Neuron AI 6月19日日报 / IT之家6月18日Shazeer报道 / 腾讯新闻6月18日 / 搜狐6月19日 / CNBC 6月19日Jumper报道 / Bloomberg 6月19日 / Android Authority Gemini Live记忆报道6月19日 / 9to5Google 6月18日

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

推荐阅读

  • 造 Transformer 的人去了 OpenAI,拿诺奖的去了 Anthropic——你用的 AI 工具该换吗?

    6 月 18 日,Noam Shazeer 在 X 上发了一条告别帖:”很高兴分享我将加入 OpenAI,期待与那里卓越的团队共事。这是一个艰难的决定。”措辞克制,但信息量炸裂…

  • Vercel 把“文件目录”变成了 Agent 框架,Google 给 Agent 发了“通用语言”:6 月 17 日这两件事,普通人也能跟着玩

    Vercel 把”文件目录”变成了 Agent 框架,Google 给 Agent 发了”通用语言”:6 月 17 日这两件事,普通人也能跟着玩 如果你…

  • ChatGPT 学会“上闹钟”了:6 月 17 日新上线的计划任务功能,一份不啰嗦的实操指南

    ChatGPT 学会”上闹钟”了:6 月 17 日新上线的计划任务功能,一份不啰嗦的实操指南 如果你跟 ChatGPT 打过一年以上的交道,一定经历过这种时刻:今天突然想起来上…

  • 你的AI编程助手被人劫持了:Agentjacking攻击85%成功率,一份不废话的防御指南

    场景还原一下:你正在用 Claude Code 处理一个 Sentry 里积压的报错。输入”帮我修一下这些 unresolved issues”,Claude Code 通过 …

暗夜独行