联想AI收入翻倍，微软却在“裁员”AI：同一场革命，两张完全不同的账单

5月22日，两个新闻放在一起看，AI行业的真相就出来了。

昨天，联想发了财报。2025/26财年，AI相关收入同比增长105%，全年集团营收突破5899亿元人民币，股价直接飙了15%。杨元庆说公司现在是一家”全球AI生态链领先企业”——这话搁两年前说，市场可能当笑话听；今天，账本摆在那里。

同一天，Fortune的一篇报道指向了另一个方向：微软已经悄悄取消了大部分员工的Claude Code许可证。 原因是——用的人太多，Token账单控不住了。六个月前，微软还鼓励上千名工程师、设计师、PM们”多用AI”，搞了内部激励和排行榜；现在，安全帽摘了。

Uber更惨。CTO Praveen Neppalli Naga在一个内部场合透露，公司4个月就烧光了2026全年的AI编程工具预算。

而Nvidia应用深度学习副总裁Bryan Catanzaro对Axios说的原话是：”就我的团队而言，计算成本远超员工成本。”

同一个AI故事，两种完全不同的结局。这不是偶然。

一、卖”铲子”的，数钱数到手抽筋

联想的财报是个标本。

拆开看，AI收入不是靠单一业务撑起来的，是三条线的协同：

AI服务器（ISG）：全年收入同比增长50%，季度收入持续刷新历史新高。更关键的一个数字——订单储备超过1400亿元人民币，意味着后面几个季度基本已经锁定了。ISG全年营收超1360亿元，同比增长32%，成功扭亏为盈。
AI PC（IDG）：AI PC占个人电脑总出货量已超30%，高端PC出货占比达50%，PC全球份额24.2%创历史新高。
AI解决方案服务（SSG）：连续20个季度实现双位数增长，运营利润率22.4%。

联想的逻辑不是”我有AI功能所以卖得好”，而是”企业要部署AI，先得买我的服务器；买完服务器，散热不够还得上我的海神液冷；买完硬件不知道咋用，还得买我的方案服务”。

这是经典的基础设施飞轮——你挖金子不一定赚，但卖铲子一定赚。

Arm上周的股价涨了近50%，背后也是AI算力需求拉动了芯片设计授权。更早之前，我们在网站上聊过Cerebras的IPO——一家做整块晶圆芯片的公司市值冲到了660亿美元，也是在”卖基础设施”这个故事里分到了一大杯羹。

二、买”铲子”去挖金的人，开始慌了

微软取消Claude Code这件事，放在AI行业三年来的叙事背景里，几乎是打脸的。

过去三年，行业讲的统一故事是：AI越用越便宜（因为推理成本在持续下降），所以企业应该鼓励员工拼命用AI。Meta搞了内部排行榜叫”Claudeonomics”追踪谁的AI使用量最多；Amazon推动员工搞”tokenmaxx”——尽可能多烧Token的文化。

然后，微软先醒了。

按Fortune的报道，Claude Code这个工具”太受欢迎”，用的人和使用频率远超预期。按调用量计费的Token账单像滚雪球一样膨胀。最后微软算了一笔账：继续这么烧下去，成本比让员工老老实实用GitHub Copilot CLI高得多——毕竟Copilot是按人头收费，账单是线性的；而按Token计费的Claude Code，是人用得越勤快，公司破产越快。

Uber的情况更直白。他们的CTO说，公司内部有排行榜激励各团队使用AI编程工具，结果”积极性严重超预期”——4个月就用完了全年的钱。

Nvidia的Bryan Catanzaro说这话的时候，是最有意思的。Nvidia是卖算力的既得利益者，他没理由唱衰AI成本——但他就是说了实话：计算成本远超员工成本。

这就形成了一个黑色幽默的局面：AI提高了员工效率，但效率提升带来的Token消耗，把省下来的人工成本全吃掉了。甚至还有多。

再联想到之前我们在网站上聊过的7250亿美元算力黑洞——大模型厂商在烧钱建基础设施，企业在烧钱用AI。从供应链上游到下游全在烧，唯一稳赚的，是卖铲子的人。

三、”更便宜的Token”不等于”更便宜的AI”

这里有个关键账要算清楚。

很多人看到大模型API价格一降再降——GPT从3.5到5.5，API价格跌了不止一个数量级；DeepSeek V3的API价格更是低到让硅谷喊”倾销”——直接得出一个结论：AI会越来越便宜。

账不是这么算的。

Goldman Sachs 5月22日发布的最新预测里有一个数据：到2030年，因为Agent式AI的普及，Token消耗量将增长24倍，达到每月12亿亿个Token。

一个24小时不间断运行的AI Agent，跟一个人偶尔提个问题的Chatbot，是完全不同的物种。Agent每做一个决策就要调一次模型，一天调用几百几千次——就算单次调用成本降了90%，乘以1000倍的调用次数，总账还是原来的100倍。

Gartner的高级总监分析师Will Sommer有一句话很精辟：”首席产品官不应该将商品Token的通缩，与前沿推理能力的民主化混为一谈。”

翻译成人话：便宜的Token，是基础模型做简单任务的Token。真正要用到的Agent推理（reasoning），不便宜。

这个差别，跟中国大模型调用量碾压美国那篇文章里的趋势是对得上的：便宜的模型（尤其是中国开源模型）正在大量吃掉市场份额。Artificial Analysis的数据显示，完成同样的10项任务，Claude需要4811美元，GPT需要3357美元，DeepSeek只需要1071美元。

开源的腾讯混元Hy3、字节的豆包这些国产模型，也正在把大模型的API价格打到人民币级别。

不是OpenAI和Anthropic不想降价，是它们的算力成本结构不允许。就在前天我们的文章里聊过，Anthropic刚和SpaceX签了450亿美元的算力合同，月均付12.5亿——不涨价，怎么回本？

四、一个结构性拐点

5月22日的新闻里，还有一个信号容易被忽略：Google开源了Agent Executor（AX）。

这不是Google发布的第N个AI应用工具，而是一个底层基础设施——一个用Go语言写的分布式Agent运行时。它不管你的Prompt怎么写，它管的是一件事：保证你的Agent不崩溃、能恢复、能分叉探索。

Agent跑着跑着挂了怎么办？多个Agent同时操作一个任务怎么不打架？会话状态断了怎么续上？

传统的AI框架（LangChain、CrewAI这类）是在应用层解决这些问题——写Python逻辑，靠开发者自己保证可靠性。Google AX的思路反过来：把可靠性做在运行时层。

这意味着什么？意味着行业对”AI成本”的理解，正在从”模型API价格是多少”升级到”运行可靠性和系统工程成本是多少”。你单次API价格降了又怎样？Agent跑着跑着崩了，重跑一轮又是几十万Token。稳定性，才是真正的成本优化。

同一天，字节跳动开源了Lance——一个30亿参数的统一多模态模型，能同时做图像和视频的理解、生成、编辑，只需要40GB显存的单张GPU就能跑。

Google在做基础设施让Agent可靠运行，字节在开源小模型降低部署成本——两条路线，指向同一个方向：让AI更低成本、更可靠地跑起来。

五、三条血泪教训

从联想财报、到微软取消Claude Code、再到Uber的预算崩溃，能抽出三件事：

第一条：按量计费的AI，在”鼓励所有人多用”的激励机制下，一定超预算。 Token消耗跟员工积极性呈正比——员工用得越积极，公司破产越快。企业如果真要推广AI，要么走固定成本的套餐模式，要么设硬性的Token配额。否则Uber那种四个月烧光全年钱的剧本，就是标准结局。

第二条：这波AI浪潮，真正稳赚的只有卖基础设施的人。 联想的AI服务器1400亿订单储备、Arm的50%周涨幅——这些不是”AI概念炒上去的”，是真金白银的订单在撑。之前那篇Cerebras的660亿美元估值，也应该从这个角度重新理解：那不是AI公司的泡沫，是”算力基础设施供应商”被市场用订单投了票。

第三条：Google开源Agent Executor、字节开源Lance，说明行业正在从”卷模型”转向”卷基础设施和可靠性”。 当模型能力强到一定程度之后，决定AI能否落地的，不再是模型本身的benchmark分数，而是它能不能稳定地跑完一整天的任务。可靠性和成本控制，是下一个阶段的胜负手。

最后

5月22日这条新闻线，最妙的是两个画面：

画面一：联想财报发布会上，高管笑着展示”AI收入增长105%”，股价涨了15%。

画面二：微软某个CIO看着Claude Code的Token账单挠头——这玩意儿花得比开发人员工资还多。

同一个AI故事。卖水的发了大财，挖金子的发现铲子并不便宜。

AI不贵。“拼命用AI”才贵。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我进行处理。

发表回复取消回复

Open Claw：让 AI 真正“动手”的智能体革命

零成本玩转OpenClaw：免费API接入与避坑指南

如何为OpenClaw AI角色设置独特的人设

PicShrink：一个专注于实用的图片压缩工具

2026年“Claw”家族全系工具大盘点

Anthropic登顶9000亿、Grok没人用：AI行业的冰火两重天