2026年5月31日那期AI内参里有一句话,我读完愣了一下:
“中国大模型’六小虎’战略’迫降’,面对巨头算力垄断与资本收缩,集体放弃通用模型豪赌,转向深耕医疗等垂直行业。”
这说的不是某一家公司,是智谱、MiniMax、百川、零一万物、阶跃星辰、DeepSeek 这六家。三年、几百亿砸进去,最后集体认栽,这个故事比任何单篇模型发布都有意思。
“六小虎”这个称呼本身就很说明问题
2023年谁都觉得自己能成为”中国版OpenAI”。那时候融资容易,benchmark刷榜就能上头条,估值按”OpenAI的几分之一”来算。
现在回头看,那是个错觉。
六家手里都有能打的东西——智谱的GLM系列学术底色重,DeepSeek的算法效率公认顶尖,MiniMax在多模态上走得早。但问题是:大家都在做同一件事,而且这件事的终局谁都看不清。
训练一个千亿参数模型,算力成本就要数亿美元。这不是一次性投入,是持续烧钱——模型要迭代,竞品在提速,用户量在涨,每条都在烧卡。
三件事同时发生,谁都扛不住
第一件事是DeepSeek在5月底开始限制”重新生成”次数。这个细节比任何财报都能说明问题——连以算法效率著称的DeepSeek都算力告急了,而且它还是六小虎里最省的那一个。
第二件事是资本态度变了。2026年Q1之后,投资机构听到”通用大模型”这四个字基本就摇头。不是不看好AI,是看不到盈利路径。反倒是Anthropic拿到的9650亿估值,反而把压力全部转嫁到了独立创业公司身上——你凭什么值这个价?
第三件事是大厂的反扑。字节豆包日均120万亿Token,这个数字不是靠模型强拿到的,是靠生态。腾讯混元、阿里通义也是同样的逻辑。有场景的大厂做通用模型,成本是摊薄的;独立公司做通用模型,每一分钱都是自己的。
这三件事加在一起,通用的故事就讲不下去了。
医疗只是一个开始,而且医疗本身也难
现在六小虎里转到医疗方向的最多。智谱的GLM已经在几家三甲医院跑辅助诊断,百川2024年就搭了医疗BG,据说2026年开始有实际收入。
但医疗这个方向我并不看好所有人都扎进去。医疗的付费意愿确实强,但合规成本、数据获取、责任归属,每一个都是坑。 国外连Anthropic和OpenAI都还在试探阶段,国内这些公司能不能真正落地,我持保留态度。
除了医疗,我看到更有意思的方向反而是制造。
这个方向几乎没有哪家”六小虎”真正做深,但需求是真实存在的。我之前写过一篇AI实战应用指南,里面提到过几个工厂场景,后来有读者私信我说他们厂已经在用视觉检测了——不是大模型,但是方向是对的。大模型+制造的场景,现在是一片蓝海,因为大厂看不上,创业公司又不敢碰。
金融和法律也是类似的状况,但这两个方向对准确率的要求近乎苛刻,不是堆参数就能解决的。
和2023年的”行业大模型”不是一回事
2023年那波”行业大模型”热潮,说实话大部分是糊弄人的。在通用模型上加几百条行业数据做微调,就敢叫”XX行业大模型”,这件事我当时就想吐槽。
这一波不一样的地方在于:不再追求发论文刷榜了,开始派人蹲在客户工位上改需求了。
这个转变很痛苦,但它是唯一能产生收入的路径。我之前分析过DeepSeek砍向AI编程那篇文章,里面提到一个细节——做Agent Harness本质上就是在做业务,不是在刷benchmark。六小虎现在的逻辑是一样的:模型只是工具,能帮客户解决问题才叫产品。
对开发者和企业用户,现在意味着什么?
如果你是个开发者,我的建议是:现在是对接垂直场景API最好的时机。六小虎为了留住开发者生态,通用模型API的价格还会继续降,但真正值钱的,是那些在医疗、金融、法律场景里有深度集成的API。如果你在做这些方向的产品,现在去聊,他们愿意给的条件比2023年好得多。
如果你是企业用户,之前犹豫要不要用大模型,现在可以认真看了。价格已经降到2023年的几十分之一,而且垂直场景的准确率比当时的通用模型高得多。 我之前写过本地部署大模型的指南,其实现在最划算的不是本地部署,是直接在垂直场景里用这些公司的API。
对六小虎自己来说,这是一场生死考验。转垂直意味着承认自己赢不了通用模型的战争,但至少还有机会在一个细分市场里活下来。活不活得下来,取决于执行,不取决于PPT。 这句话说起来简单,做起来每一个坑都是拿钱填的。
最后
中国AI的这场”战略迫降”,我更愿意把它看成一次集体认知修正。
通用人工智能当然是终极目标,但它不是每家公司的商业路径。这个道理2023年没人愿意听,2026年被迫接受了。
那些能在垂直行业里真正扎根下来的公司,不一定会成为下一个OpenAI,但有可能成为下一个在细分领域不可替代的基础服务商。这未必是最坏的结果,甚至可能是最好的结果。
毕竟,一个所有公司都想着做通用模型的市场,才是真正不正常的。




发表回复