5月22日,两个新闻放在一起看,AI行业的真相就出来了。
昨天,联想发了财报。2025/26财年,AI相关收入同比增长105%,全年集团营收突破5899亿元人民币,股价直接飙了15%。杨元庆说公司现在是一家”全球AI生态链领先企业”——这话搁两年前说,市场可能当笑话听;今天,账本摆在那里。
同一天,Fortune的一篇报道指向了另一个方向:微软已经悄悄取消了大部分员工的Claude Code许可证。 原因是——用的人太多,Token账单控不住了。六个月前,微软还鼓励上千名工程师、设计师、PM们”多用AI”,搞了内部激励和排行榜;现在,安全帽摘了。
Uber更惨。CTO Praveen Neppalli Naga在一个内部场合透露,公司4个月就烧光了2026全年的AI编程工具预算。
而Nvidia应用深度学习副总裁Bryan Catanzaro对Axios说的原话是:”就我的团队而言,计算成本远超员工成本。”
同一个AI故事,两种完全不同的结局。这不是偶然。
一、卖”铲子”的,数钱数到手抽筋
联想的财报是个标本。
拆开看,AI收入不是靠单一业务撑起来的,是三条线的协同:
- AI服务器(ISG):全年收入同比增长50%,季度收入持续刷新历史新高。更关键的一个数字——订单储备超过1400亿元人民币,意味着后面几个季度基本已经锁定了。ISG全年营收超1360亿元,同比增长32%,成功扭亏为盈。
- AI PC(IDG):AI PC占个人电脑总出货量已超30%,高端PC出货占比达50%,PC全球份额24.2%创历史新高。
- AI解决方案服务(SSG):连续20个季度实现双位数增长,运营利润率22.4%。
联想的逻辑不是”我有AI功能所以卖得好”,而是”企业要部署AI,先得买我的服务器;买完服务器,散热不够还得上我的海神液冷;买完硬件不知道咋用,还得买我的方案服务”。
这是经典的基础设施飞轮——你挖金子不一定赚,但卖铲子一定赚。
Arm上周的股价涨了近50%,背后也是AI算力需求拉动了芯片设计授权。更早之前,我们在网站上聊过Cerebras的IPO——一家做整块晶圆芯片的公司市值冲到了660亿美元,也是在”卖基础设施”这个故事里分到了一大杯羹。
二、买”铲子”去挖金的人,开始慌了
微软取消Claude Code这件事,放在AI行业三年来的叙事背景里,几乎是打脸的。
过去三年,行业讲的统一故事是:AI越用越便宜(因为推理成本在持续下降),所以企业应该鼓励员工拼命用AI。Meta搞了内部排行榜叫”Claudeonomics”追踪谁的AI使用量最多;Amazon推动员工搞”tokenmaxx”——尽可能多烧Token的文化。
然后,微软先醒了。
按Fortune的报道,Claude Code这个工具”太受欢迎”,用的人和使用频率远超预期。按调用量计费的Token账单像滚雪球一样膨胀。最后微软算了一笔账:继续这么烧下去,成本比让员工老老实实用GitHub Copilot CLI高得多——毕竟Copilot是按人头收费,账单是线性的;而按Token计费的Claude Code,是人用得越勤快,公司破产越快。
Uber的情况更直白。他们的CTO说,公司内部有排行榜激励各团队使用AI编程工具,结果”积极性严重超预期”——4个月就用完了全年的钱。
Nvidia的Bryan Catanzaro说这话的时候,是最有意思的。Nvidia是卖算力的既得利益者,他没理由唱衰AI成本——但他就是说了实话:计算成本远超员工成本。
这就形成了一个黑色幽默的局面:AI提高了员工效率,但效率提升带来的Token消耗,把省下来的人工成本全吃掉了。甚至还有多。
再联想到之前我们在网站上聊过的7250亿美元算力黑洞——大模型厂商在烧钱建基础设施,企业在烧钱用AI。从供应链上游到下游全在烧,唯一稳赚的,是卖铲子的人。
三、”更便宜的Token”不等于”更便宜的AI”
这里有个关键账要算清楚。
很多人看到大模型API价格一降再降——GPT从3.5到5.5,API价格跌了不止一个数量级;DeepSeek V3的API价格更是低到让硅谷喊”倾销”——直接得出一个结论:AI会越来越便宜。
账不是这么算的。
Goldman Sachs 5月22日发布的最新预测里有一个数据:到2030年,因为Agent式AI的普及,Token消耗量将增长24倍,达到每月12亿亿个Token。
一个24小时不间断运行的AI Agent,跟一个人偶尔提个问题的Chatbot,是完全不同的物种。Agent每做一个决策就要调一次模型,一天调用几百几千次——就算单次调用成本降了90%,乘以1000倍的调用次数,总账还是原来的100倍。
Gartner的高级总监分析师Will Sommer有一句话很精辟:”首席产品官不应该将商品Token的通缩,与前沿推理能力的民主化混为一谈。”
翻译成人话:便宜的Token,是基础模型做简单任务的Token。真正要用到的Agent推理(reasoning),不便宜。
这个差别,跟中国大模型调用量碾压美国那篇文章里的趋势是对得上的:便宜的模型(尤其是中国开源模型)正在大量吃掉市场份额。Artificial Analysis的数据显示,完成同样的10项任务,Claude需要4811美元,GPT需要3357美元,DeepSeek只需要1071美元。
开源的腾讯混元Hy3、字节的豆包这些国产模型,也正在把大模型的API价格打到人民币级别。
不是OpenAI和Anthropic不想降价,是它们的算力成本结构不允许。就在前天我们的文章里聊过,Anthropic刚和SpaceX签了450亿美元的算力合同,月均付12.5亿——不涨价,怎么回本?
四、一个结构性拐点
5月22日的新闻里,还有一个信号容易被忽略:Google开源了Agent Executor(AX)。
这不是Google发布的第N个AI应用工具,而是一个底层基础设施——一个用Go语言写的分布式Agent运行时。它不管你的Prompt怎么写,它管的是一件事:保证你的Agent不崩溃、能恢复、能分叉探索。
Agent跑着跑着挂了怎么办?多个Agent同时操作一个任务怎么不打架?会话状态断了怎么续上?
传统的AI框架(LangChain、CrewAI这类)是在应用层解决这些问题——写Python逻辑,靠开发者自己保证可靠性。Google AX的思路反过来:把可靠性做在运行时层。
这意味着什么?意味着行业对”AI成本”的理解,正在从”模型API价格是多少”升级到”运行可靠性和系统工程成本是多少”。你单次API价格降了又怎样?Agent跑着跑着崩了,重跑一轮又是几十万Token。稳定性,才是真正的成本优化。
同一天,字节跳动开源了Lance——一个30亿参数的统一多模态模型,能同时做图像和视频的理解、生成、编辑,只需要40GB显存的单张GPU就能跑。
Google在做基础设施让Agent可靠运行,字节在开源小模型降低部署成本——两条路线,指向同一个方向:让AI更低成本、更可靠地跑起来。
五、三条血泪教训
从联想财报、到微软取消Claude Code、再到Uber的预算崩溃,能抽出三件事:
第一条:按量计费的AI,在”鼓励所有人多用”的激励机制下,一定超预算。 Token消耗跟员工积极性呈正比——员工用得越积极,公司破产越快。企业如果真要推广AI,要么走固定成本的套餐模式,要么设硬性的Token配额。否则Uber那种四个月烧光全年钱的剧本,就是标准结局。
第二条:这波AI浪潮,真正稳赚的只有卖基础设施的人。 联想的AI服务器1400亿订单储备、Arm的50%周涨幅——这些不是”AI概念炒上去的”,是真金白银的订单在撑。之前那篇Cerebras的660亿美元估值,也应该从这个角度重新理解:那不是AI公司的泡沫,是”算力基础设施供应商”被市场用订单投了票。
第三条:Google开源Agent Executor、字节开源Lance,说明行业正在从”卷模型”转向”卷基础设施和可靠性”。 当模型能力强到一定程度之后,决定AI能否落地的,不再是模型本身的benchmark分数,而是它能不能稳定地跑完一整天的任务。可靠性和成本控制,是下一个阶段的胜负手。
最后
5月22日这条新闻线,最妙的是两个画面:
画面一:联想财报发布会上,高管笑着展示”AI收入增长105%”,股价涨了15%。
画面二:微软某个CIO看着Claude Code的Token账单挠头——这玩意儿花得比开发人员工资还多。
同一个AI故事。卖水的发了大财,挖金子的发现铲子并不便宜。
AI不贵。“拼命用AI”才贵。




发表回复