豆包日均120万亿Token:字节AI的全线爆发,以及那个刚开放的视频模型

4月2日,火山引擎总裁谭待在武汉的一场活动上抛出了一个数字:120万亿

这是豆包大模型截至2026年3月的日均Token调用量。中国第一,全球前三。两年前,2024年5月豆包刚发布的时候,这个数字是1200亿——也就是说,两年涨了整整1000倍

这不是科幻小说的情节,这是发生在上周的事。


120万亿是个什么概念?

光说”120万亿”没什么感觉。换个角度:这意味着全球每天通过豆包处理的文字量,已经超过地球上所有图书馆藏书总字数的数百倍。

更直观的对比来自增长曲线:

  • 2024年5月(发布初期):1200亿 tokens/天
  • 2025年12月:约63万亿 tokens/天
  • 2026年3月:突破120万亿 tokens/天

三个月翻倍,两年涨千倍。这种指数级的速度,背后是字节把AI能力塞进了它旗下几乎每一款产品——豆包App、抖音的创作助手、飞书的AI功能、剪映的智能剪辑……用户即便从没主动”用AI”,每天刷短视频、写飞书文档,也在不知不觉中消耗着豆包的推理算力。

这个打法和其他大模型公司有本质区别。大多数AI公司还在靠API卖算力,字节直接把模型能力嵌进了日活十亿级的产品里。流量换Token,这是目前最有效率的规模化路径。

在企业端,火山引擎的数据也在印证这一趋势:平台上累计Token使用量超过一万亿的企业客户,已从去年底的100家增长到140家,三个月多了40家。


国产模型的Token反超,静悄悄地发生了

谭待没有特别渲染,但话里藏着一个信息量很大的判断:国产大模型的整体调用量,已连续一个月超越海外主流模型。

这句话值得停一下想想。就在一年多前,很多从业者还在担心国内模型跟国际的差距什么时候才能追平。现在,至少在使用量这个维度,反超已经是既成事实。

当然,有几点需要客观看待:

  1. 中文场景的天然优势。国产模型在中文理解、本土知识、内容合规上本来就比海外模型更适配。大量中文场景的AI需求,国内模型是首选。
  2. 定价策略的作用。过去一年,主流国产模型的API价格大幅下探,部分模型对轻量用户甚至提供了相当长时间的免费额度,直接推动了调用量快速放量。
  3. 生态绑定的力量。像豆包这样深度集成进字节系产品,百度文心嵌入搜索和文档,阿里通义贯穿钉钉和淘宝——这些不是靠技术指标赢的,是靠渠道和生态赢的。

这不是说技术不重要,而是说在这个阶段,落地速度和生态覆盖,可能比参数量更决定谁能跑出来。


同一天,Seedance 2.0 开放了

就在豆包公布120万亿数据的同一天,字节还推了另一件事:Seedance 2.0 正式开放API申请

Seedance是字节的视频生成模型,2.0版本在今年2月发布。4月2日,它面向完成企业认证的用户开放了API。

视频生成这个赛道,目前国内玩家已经相当多,可灵、即梦、Vidu都有一定用户基础。Seedance 2.0想要在这里找到差异化,主要押注在三个方向上:

1. 声画原生同步 传统的AI视频生成,音频和视频是分开生成然后拼在一起的——这导致嘴型对不上、声音和画面节奏脱节的问题很常见。Seedance 2.0宣称做到了”原生声画同步”,音视频在同一个生成过程里联合处理,不需要后期配音。

2. 导演级相机控制 能精确控制镜头运动:推拉摇移、焦点变化、跟拍等。这对想用AI做视频内容的创作者来说意义比较实际——不是生成一个随机的画面,而是你能描述想要什么镜头语言,它执行。

3. 角色一致性 在多帧、多场景的视频里保持同一个人物外观一致,这是AI视频的老大难问题。Seedance 2.0在这一点上号称有明显改进。

目前的开放是面向企业用户的API,还需要走企业认证。普通用户的体验入口是字节旗下的即梦AI([jianying.com](https://jianying.com),剪映的AI创作平台),部分功能已经在里面集成了。


这跟我有什么关系?

如果你是内容创作者,Seedance 2.0的开放是个值得关注的信号。过去AI视频的最大痛点是”生成的东西很漂亮但没法用”——镜头失控、角色乱跳、声音和画面不搭。如果上面说的几点改进是真的,意味着AI视频从”演示品”变成”生产工具”的进程又近了一步。

如果你是开发者,火山引擎的API是个值得纳入工具箱的选项。豆包大模型2.0系列在多模态理解和复杂任务执行上有明显进步,而且中文能力基本不用担心。关于如何在本地或者云端部署和调用大模型,可以参考站内之前写的本地部署大模型完全指南,里面有Ollama和LM Studio的完整流程对比。

如果你只是普通用户,120万亿这个数字对你的直接影响,可能就是你每天用豆包App、抖音、飞书的体验在悄悄变好——模型推理更快,回答更准,功能越来越多。这就是那1000倍增长换来的东西。


字节AI的逻辑

把这两件事放在一起看,能隐约看到字节做AI的整体逻辑:

  • 豆包:走量,用字节的产品矩阵把模型使用量堆到一个难以超越的规模。
  • Seedance:补齐视频生成这块多模态拼图,在内容生产这个字节的主战场保持技术壁垒。

这和OpenAI主推API生态、Anthropic押注安全和企业的路线都不一样。字节的核心竞争力始终是内容平台,AI对他们来说是把这个平台护城河挖得更深的工具。

所以你看到的不是一家”AI公司”,而是一家”用AI武装起来的内容公司”在展示战绩。120万亿,只是这张成绩单上的一个数字。


更多AI工具的实战玩法,可以看这篇:AI实战应用指南(2026版):普通人也能用好的10个场景

如果你对本地跑大模型感兴趣,这篇是目前最完整的教程:本地部署大模型完全指南(2026版):Ollama 与 LM Studio 实战对比


数据来源:火山引擎”2026 Force Link AI 创新巡展·武汉站”活动披露,2026年4月2日

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

推荐阅读

  • 月赚5.59亿,月花12.5亿:Anthropic的盈利魔幻与现实

    5月21日,两条新闻几乎同时炸开。 第一条:Anthropic预计2026年Q2营收109亿美元,将实现公司成立以来的首个季度盈利——营业利润5.59亿美元。华尔街日报头版报道,投资人集体沸腾,Ant…

  • AI开始替代整个部门:李开复最新判断,表演式AI该停了

    5月19日,上海AMD AI开发者日2026,零一万物CEO李开复与AMD CEO苏姿丰进行了一场炉边对话。主题是”AI智能体新范式”,但真正引发现场两千多名开发者共鸣的,是李…

  • Google I/O 2026:Gemini月活9亿,股价却跌了——这一次,饼不够香?

    就在刚刚过去的这个凌晨,Google I/O 2026在美国加州山景城落下帷幕。 从Token处理量到月活用户数,从Gemini模型更新到智能眼镜新品,Google拿出了一份看似极具分量的发布清单。然…

  • 中国大模型调用量连续三周碾压美国:腾讯混元单周2.66万亿Token登顶,DeepSeek集团军破4万亿

    上周(5月11日至17日),OpenRouter平台上发生了一件值得标记在AI编年史上的事:中国大模型的周调用量,连续第三周碾压美国。 不是某一款模型的偶发爆发,也不是靠免费策略刷出来的虚高数字——腾…

暗夜独行