美团一天开源7个AI项目,阿里拉瑞幸肯德基入局,豆包开始收费:中国互联网巨头不卷模型了

上周(6月3日到7日),三家中国互联网巨头各自放了一颗信号弹。

6月3日,阿里宣布千问APP向第三方Agent和Skill全面开放,瑞幸、肯德基、蜜雪冰城、东方航空成为首批接入企业。同一天,豆包发布官方声明——即将推出专业版,覆盖软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究六大领域,6月下旬开始收费。

6月7日,美团技术团队一口气开源了7个AI项目:数字人视频模型 LongCat-Video-Avatar 1.5、通用推理评测集 General 365、具身智能评测基准 LARYBench、数学定理证明模型 LongCat-Flash-Prover、零样本TTS模型 LongCat-AudioDiT、原生多模态模型 LongCat-Next、以及面向OpenClaw的效率引擎API。还顺便公开了一份31万行代码、90%以上由AI生成的编程管理实践报告。

三条新闻,表面上看互不相干。但把它们放在一起看,你会发现一个正在发生的结构性变化:中国互联网巨头不再把”谁的模型参数更大”当作首要战场了。他们在抢另一块地盘——谁能把AI变成真正可用的工具链,谁能让AI嵌入真实的商业场景,谁能从”免费圈用户”切换到”靠专业能力赚钱”。


美团:不造通用大模型,但把AI的周边全包了

美团可能是中国互联网巨头里对”造模型”最佛系的一家。它没有发布过对标GPT的大语言模型,没有参与”万亿参数俱乐部”的军备竞赛,甚至很少在AI模型榜单上刷存在感。

但你仔细看6月7日它开源的这7个项目,会发现一个有意思的模式。

General 365 是一个通用推理评测集,包含365道覆盖八大推理维度的原创题目。美团用它实测了26款主流模型,结果让人有点意外:地表最强的 Gemini 3 Pro 准确率仅 62.8%,绝大多数模型没摸到60分的及格线。这其实是一个很”美团”的动作——你不是说你的模型很强吗?那我建一把尺子,量一量你到底有多强。这种”不造轮子、但制定标准”的打法,跟美团在外卖行业做的事情逻辑一致。

LARYBench 被定义为具身智能领域的”ImageNet”——一个评测动作表征能力的基准。美团团队的实验结论有点颠覆性:通用视觉模型在动作泛化和控制精度上,显著优于那些专门为具身智能训练的”专家模型”。换句话说,你不需要专门造一个机器人视觉模型,大规模的互联网视频数据本身就包含了足够的”动作知识”,关键是能不能把它提取出来。

31万行代码、90%+由AI生成——这是美团技术团队分享的编程管理实践里最触目惊心的数字。当代码绝大多数是AI写的,传统的code review、单元测试、架构评审那一套就不够用了。美团的解法很有意思:用Agent评测的思路来管理AI生成的代码。不是让人类去逐行检查AI写了什么,而是给AI设定规则(Rule)、建立重构SOP、设计Pre-PR自动检查机制——管理AI的核心不是看它写了什么,而是约束它能怎么写。这个思路,跟我们在Vibe Coding已死的讨论Google 75%代码AI生成的分析里聊到的问题,方向完全一致。

LongCat系列的其他几个模型也很有看头。LongCat-Video-Avatar 1.5 在唇形同步、物理合理性、长视频稳定性、多人互动、高效推理五个维度做了升级,已经可以稳定输出商业级数字人内容。LongCat-AudioDiT 抛弃了传统的梅尔谱中间表示,直接在波形潜空间用扩散模型做语音合成——从根源上阻断了数据转换的级联误差,声音克隆的真实度大幅提升。LongCat-Flash-Prover 解决的是AI数学推理最头疼的问题:模型会”猜答案”,但缺乏严谨的逻辑链条。

还有一个细节值得注意:美团专门为 OpenClaw 推出了一套官方免费API(效率引擎),替代之前开发者常用的第三方订阅方案,官方宣称效率可提升30%。这不是一个很大的技术动作,但它说明了一件事——美团很清楚,AI工具链的最后一公里,不是模型本身,而是模型怎么接入真实工作流。

美团这套组合拳的本质是:我不造发动机,但我把底盘、变速箱、仪表盘、导航系统全给你配齐了。 它不跟OpenAI、Anthropic去拼基础模型的性能,但它正在系统性地构建一个”让AI真的能用起来”的完整工具链——从评测基准,到编程管理,到多模态生成,到工作流API。


阿里千问:从聊天框到商业入口

如果说美团做的是”幕后工具链”,那阿里千问做的就是”台前商业入口”。

6月3日,千问宣布了一个关键转向:向第三方Agent和Skill全面开放。这个动作的潜台词是,千问不再满足于做一个”你问我答”的AI助手,它在试图成为一个AI时代的应用分发平台

具体来看,千问把开放分成了两层。第一层是 Skill——企业可以把自己的服务打包成一个”技能”,用户在千问里直接调用。比如你对着千问说”帮我点一杯瑞幸的生椰拿铁”,千问就能拉起瑞幸的Skill,完成从选品到下单的完整链路。首批接入的企业包括瑞幸、肯德基、蜜雪冰城、东方航空,覆盖了咖啡、快餐、茶饮、出行四个高频消费场景。

第二层是 Agent——企业可以在千问里运营自己的品牌智能体,自定义人设、设定服务边界。更关键的是,千问给Agent配备了记忆和主动规划能力:它能记住你的消费偏好,在你的会员权益快到期时主动提醒,在你常点的商品有优惠时推送推荐。这跟之前在AI Agent元年的讨论里分析的趋势完全吻合——Agent的价值不在”能聊天”,而在”能主动做事”。

千问敢这么玩的底气来自它的用户规模。截至4月底,千问APP月活突破1.65亿,同比增长4241%,是国内增速最快的AI应用。今年一季度,月活净增1.26亿人次,跃居国内AI应用月活第二。有这样的用户盘子,它才有资本吸引瑞幸、肯德基这样的头部消费品牌入驻。

但这个故事的背面是:千问在赌,用户将来不是打开瑞幸APP点咖啡,而是打开千问让Agent去点。这场赌局的对手,不是其他AI助手,而是微信小程序、支付宝、美团——所有已经占住了”服务入口”位置的超级平台。


豆包:免费获客结束,专业能力开始标价

同一天(6月3日),豆包发了一份措辞谨慎的声明,核心就一句话:我们要开始收费了。

豆包专业版覆盖软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究六个领域。基础功能——搜索问答、写作生图、语音视频对话——继续免费,但”专业生产力”需要付费。6月下旬正式上线。

这个决定背后的数据不难猜。第三方监测显示,豆包的月活在今年首次出现了下滑。免费模式跑了一年多,用户规模触顶的信号已经出现。与此同时,每天120万亿Token的调用量(我们之前在中国大模型调用量超过美国的分析里提过这个数据),意味着推理成本是一个天文数字。免费越大,亏得越多。

豆包的收费逻辑其实很清晰:基础功能免费维持用户规模,专业功能收费筛选高价值用户。 这跟ChatGPT Plus、Claude Max的路径没有本质区别。区别在于,豆包选择切入的是”专业生产力”这个细分市场——不是让所有人都掏钱,而是让真正用AI干活的人掏钱。

这一点跟美团和阿里的动作放在一起看,会浮现出一个共同的底层逻辑:中国AI行业正在从”免费换规模”的阶段,进入”价值换收入”的阶段。 中国AI”六小虎”从通用模型转向垂直行业,是创业公司在找能赚钱的场景(见六小虎战略迫降的分析);豆包推专业版收费,是平台型产品在找能持续的商业模型。两件事的指向一模一样:AI不能只烧钱,得有人买单。


三条线,同一个信号

把美团、阿里、豆包的这三件事放在一起,你会发现它们指向的是AI竞争格局的一次深层变化。

第一,从”卷模型参数”到”卷工具链完整性”。美团不造模型,但它开源了评测基准、编程管理框架、多模态工具链,本质上是在定义”AI怎么用”的标准。这比”我的模型多少参数”更底层,也更有粘性——你换了模型,工具链不用换。

第二,从”通用对话”到”场景化服务”。千问不再强调”我能聊多少话题”,而是在强调”我能帮你点咖啡、订机票、管理会员权益”。豆包专业版不再讲”我能写多长的文章”,而是讲”我能帮你做软件开发、数据分析、金融建模”。AI从一个”什么都会一点”的聊天工具,变成了”在特定场景下真的好用”的生产力工具。

第三,从”免费圈地”到”价值定价”。豆包收费、千问做商业Agent(企业接入不可能永远免费)、美团的效率引擎API虽然现在免费但已经为商业闭环铺垫——三家都在做同一件事:让AI产生可量化的商业价值,然后从这个价值里分一杯羹。

这三条线,跟我们在DeepSeek Code Harness的分析里提到的”Model+Harness=Agent”公式,以及AI Agent安全隐患里讨论的Agent从工具到平台的演进,是同一个故事的不同切面。模型本身不再是壁垒——2026年的现实是,开源模型的能力正在迅速追平闭源模型,中国模型的调用量已经超过美国。当模型趋同的时候,谁能让模型在真实场景里产生价值,谁就掌握了下一个阶段的主动权。


最后

你可能注意到了,这三家公司里没有一家在宣布”我们的新模型在某某榜单上拿了第一”。

美团在定义AI的度量衡。阿里在定义AI的分发方式。豆包在定义AI的定价逻辑。

这三件事,没有一件是关于”模型更强”的。但它们每一件,都比”模型更强”更能决定AI行业接下来往哪走。

AI竞争的下半场,主角不再是模型,是场景。


本文信息来源:美团技术团队官方博客(6月7日)、阿里千问官方公告(6月3日)、字节跳动豆包官方声明(6月3日)、财新网、凤凰网科技、CNMO科技、中关村在线、21世纪经济报道等。文中观点为作者独立分析。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

推荐阅读

  • 美团一天开源7个AI项目,阿里拉瑞幸肯德基入局,豆包开始收费:中国互联网巨头不卷模型了

    上周(6月3日到7日),三家中国互联网巨头各自放了一颗信号弹。 6月3日,阿里宣布千问APP向第三方Agent和Skill全面开放,瑞幸、肯德基、蜜雪冰城、东方航空成为首批接入企业。同一天,豆包发布官…

  • Meta给AI标了价、OpenAI给AI上了锁、马斯克给AI偷偷「补课」:同一天,三堵墙同时砌起来了

    6月6日是个有意思的日子。 如果你只看一家公司的新闻,可能觉得稀疏平常 —— Meta出了个新产品、OpenAI加了个安全功能、xAI又上了一次头条。但如果你把这三件事放在一起看,画面就变了。 三件事…

  • OpenAI把编程AI塞进聊天框,GitLab转身裁了350个程序员:代码还没写完,写代码的人先「下线」了

    6月5日,两条新闻撞在了一起。 OpenAI宣布把Codex整合进ChatGPT。不是”在ChatGPT里加个编程插件”那种整合——是把整个Codex的能力变成ChatGPT的…

  • 造AI的人喊停了:Anthropic发布RSI报告,AI自我改进的速度超出所有人预期

    6月4日,Anthropic发了一篇博客。 标题是”Recursive Self-Improvement”——递归自我改进。 光看名字你可能觉得这又是一篇技术论文,跟过去那些A…

暗夜独行