每年这个时候,斯坦福 HAI 都会发一份让人读完有点后背发凉的报告。今年的423页,照例什么都没藏。
2026年4月13日,斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了第九届年度《AI指数报告》。和往年一样,它不做预测,只呼现数据——但数据说的那些话,比任何预测都更让人坐不住。
本文挑几组最值得普通人关注的数字,逐一拆解。
中美差距只剩 2.7%,但美国已在失去人
先说最被引用的那个数字:截至2026年3月,美国最强前沿模型(比如 Anthropic 的 Claude 系列)在综合能力评分上,仅领先中国最强竞争对手约 2.7%。
两年前,这个差距还有十几个百分点。
分维度看会更复杂一些:美国在已发布的前沿模型数量和高影响力专利上仍占优;中国在论文发表量、引用总量、专利申请总量和工业机器人装机量上全部领先。DeepSeek-R1 在今年2月曾短暂追平美国前沿水准,引发的那波震荡,报告也做了专门记录。
不过有一个数字比差距本身更値得关注:迁移到美国的AI学者数量,自2017年以来下降了89%,仅过去一年就跳了80%。
这不只是移民政策的问题。当一个国家在人才流入上出现这种量级的下滑,技术领先带来的护城河很难长期维持。人比论文更难复制。
三年普及 53%,超过 PC 和互联网的速度
报告里有一句话让我反复读了两遇:
生成式AI在短短三年内实现了53%的全民普及率,超过了个人电脑,也超过了互联网。
做个参照:互联网达到同等普及率花了大概七年,PC 花了更长时间。
但有意思的是,普及率并不均匀。新加坡61%、阿联酆54%都跑在前头;反而是美国,只有28.3%,在被调查国家里排到第24位。
为什么?报告给了一个线索:美国公众仅有33%认为AI会改善自身工作表现,是全球平均值40%的下方;对政府管理AI能力的信任度只有31%,在所有调查国中垒底。
乐观度低,使用意愿就低。
中国、印度、尼日利亚、阿联酌这些新兴市场,超过80%的职场人表示定期在工作中使用AI工具。这个数字在欧美明显更低。
AI Agent 的成功率:从 20% 跳到 77.3%
如果你对 AI Agent 的落地进展感兴趣,这组数据值得留意:
- 处理现实世界任务的成功率:从2025年的 20% 跃升至 77.3%
- 计算机操作任务(OSWorld 基准):最佳 Agent 成功率达到 66%
- 编程基准 SWE-bench:一年内从60%提升至接近100%
- 网络安全任务解决成功率:从2024年的 15% 飙升至 93%
后面这个数字是把双刃剑。AI 在网络安全领域的能力爆发,意味着攻防两端都在重新校准。如果你关注 AI Agent 安全隐患这件事,这组数字提供了很好的背景。
但报告同时指出一个“黳齿状前沿”(jagged frontier)现象:同一个模型,能拿数学奥林匹克金牌,却无法正确读取一个模拟时钟(正确率只有50.1%)。结构化测试里仍有约三分之一的任务失败。高能力和低可靠性并存,是当下 Agent 落地最难绕过的工程问题。
5817 亿美元投进去了,但年轻人的工作没了
全球企业AI投资在2025年达到 5817亿美元,同比增长130%。私人投资单独拿出来是 3447亿美元,也是同比翻了一倍多。
钱在涌入。同期发生了什么?
报告里有一组数据很难被忽视:美国22至25岁的年轻软件开发者就业人数,2024年下降了近20%。同期,年长开发者的数量仍在增长。
不是“AI会不会取代人类工作”的假设题,是已经发生的现实记录。初级岗位受冲击更早,这和很多人的直觉一致——毅竟AI替代的是“有明确答案的重复性任务”,而那类工作往往是新人的入场券。
报告也给出了另一面:在客服和软件开发领域,AI将从业者生产力提升了14%到26%。但这里有一个关键区分:需要判断力的任务,AI介入的效果较弱,有时甚至为负。
如果你在思考怎么用 AI 做一份副业或者经营一个一人公司,这篇关于一人公司浪潮的文章可能值得一读——AI带来的机会和它带来的就业冲击是同一枚硬币的两面。
模型越强,越不透明
这是报告里相对被低报道的一点,但非常値得记下来:
2025年,“基础模型透明度指数”的平均得分从58分降至40分。最强的那些模型,往往是最不愿意说清楚自己怎么运作的。
与此同时,AI安全事件数量从2024年的233起增长到2025年的362起,增幁55%。主流大模型的幻觉率范围是 22%到94%——这个区间宽得出奇,意味着即使是主流模型,在某些任务上仍然极不可靠。
这和我们日常使用的感受是吉合的:AI很多时候好用,但你从来不知道哪次它会“一本正经地胡说八道”。
医疗、科学:AI 真正改变了什么
最后说几个正面的。
医疗领域:多智能体系的临床诊断准确率达到 85.5%,而同条件下人类医生为 20%;自动生成病历的工具使医生书写时间减少了 83%;FDA已批准 258个 AI医疗器械。
科学领域:AI驱动的药物发现论文从431篇增至 3311篇(这7倍增长);AI已连续两年获得诺贝尔奖;自然科学领域AI相关论文同比增长了26%-28%。
一个値得关注的新前沿是“虚拟细胞”(Virtual Cells)——由 ARC 研究所的 Evo2、STATE,以及 DeepMind 的 AlphaGenome 代表的一类模型,可以预测细胞对药物和基因扰动的响应,而无需在湿实验室里做实验。这个方向在两年前几乎不存在。
不是结尾的结尾
423页报告浓缩成几组数字,总是会有遗漏。但有几件事是清楚的:
- 技术在加速,但“加速”的收益分配极不均匀
- 安全与治理的建设速度,落后于能力的增长速度
- 中美的技术差距正在消失,但人才流动的趋势更値得关注
- 对普通人来说,不是“要不要用AI”的问题,是“怎么在AI密集的环境里找到自己位置”的问题
如果你想更具体地了解怎么在日常工作中用好AI,可以看看这份2026版AI实战应用指南。
这份报告的英文全文和中译本可以在 Stanford HAI 官网 免费下载。
数据来源:Stanford HAI《AI Index Report 2026》,2026年4月13日发布




发表回复