4月5日,AI圈又炸了。
X平台上的爆料账号 @iruletheworldmo 放出大量内部消息,称OpenAI下一代旗舰模型GPT-6已经完成预训练,内部代号叫“Spud”——就是英文里的“土豆”。据说4月14日就会发布,性能比GPT-5.4提升约40%,上下文窗口扩到200万Token。
消息一出,量子位、IT之家、少数派紧接着转载跟进,热度直接拉满。但我看了这一波报道之后,有几件事想聊聊,因为大部分文章说的都差不多,有些更重要的角度反而没人提。
先说说这次曝光到底有多可信
这不是GPT-6第一次“提前曝光”了。2025年底开始,各种“土豆内部信息”就断断续续在X上流传。这次爆料的来源 @iruletheworldmo 是一个有一定追踪记录的账号,但这类消息永远需要打折扣——模型参数数字在正式发布前往往会调整,“4月14日”也可能随时推迟。
真正值得注意的是OpenAI官方的动作:公司CEO Sam Altman在X上转发了相关讨论但没有否认,GPT-6产品页面据悉已悄悄在官网留了位置。这种“默许式确认”在OpenAI的节奏里并不罕见——Sora发布前几个月的泄露也是这么过来的。
所以我的判断是:GPT-6确实快来了,但具体参数和日期,等正式发布再说。
200万Token到底意味着什么
GPT-4o的上下文窗口是128K,GPT-5.4扩到了100万,这次据报道直接到200万Token。
直观感受一下:一本《红楼梦》大约120万字,换算成Token大概在120—150万之间。200万Token意味着你可以把整个大型代码库、多本专业文献或者一个完整软件项目的所有文件塞进去,让模型一次性理解。
但更大的上下文有一个经常被忽略的问题:检索质量。早期的长上下文模型很容易“迷失在中间”——你塞进去20万Token的内容,问的问题如果答案在第10万Token附近,模型往往答不好。GPT-5.4的改进之一就是长文档中间位置的信息召回。这次GPT-6据说召回准确率提升到98%以上,如果这个数字是真的,才是真正的质变。
“AGI最后一公里”这个说法值得拆解一下
爆料里有一句话传播很广:GPT-6被OpenAI内部定位为“迈向AGI的最后一公里”。
这话听起来很轰动,但仔细想想其实挺模糊的。“AGI”到底怎么定义,业界从来没有统一标准。OpenAI自己的内部定义是“在大多数经济价值任务上达到人类中位水平”——注意是“中位”,不是顶尖。
按这个标准,GPT-4已经在很多任务上达到了,GPT-5.4也在更多任务上达到了。说GPT-6是“最后一公里”,更像是一种内部激励叙事,而不是可以被量化验证的技术声明。
换句话说,不要因为“最后一公里”这个说法就觉得以后的模型没意义了。这条路上还有很多弯。
原生多模态和“超级应用”才是真正的野心
比起参数提升,GPT-6这次的架构变化更值得关注:原生多模态,一套模型统一处理文字、图片、音频、视频,而不是之前那种“拼接”方案。
同时,据爆料GPT-6将把ChatGPT、Codex编程引擎、Atlas浏览器整合成一个统一的智能体入口。这意味着你可能不再需要“切换到ChatGPT→然后切到Codex→然后回来看结果”,而是在一个界面里让模型自主调用工具、访问网页、执行多步任务。
这个方向其实和 2026年是AI Agent元年 的判断完全吻合——过去半年里,各家大模型厂商都在往“会干活”而不只是“会说话”的方向猛踩油门。
对开发者来说,最实际的两个问题
1. 价格会变吗?
爆料说GPT-6定价与GPT-5.4持平:API输入每百万Token 2.5美元,输出12美元。如果属实,这对开发者是个好消息——性能翻了,成本不变。不过历史上OpenAI的新模型上线初期API额度都很紧张,初期速率限制估计不低。
2. 我现在应该切换到GPT-5.4吗?
如果你现在还在用GPT-4o做主力,可以考虑评估一下GPT-5.4——它的代码能力和指令遵循都有明显提升,我在这篇AI编程工具横评里有过一些对比记录。GPT-6来了之后,大概率又要重新跑一轮评测。
如果你对本地部署的方案更感兴趣,不依赖OpenAI的API,可以看看本地大模型部署完全指南,以及Ollama 0.19 的最新特性。
顺带一提:同一天还有另一条消息
就在GPT-6爆料满天飞的时候,Anthropic悄悄公布了另一件事——他们以约4亿美元收购了一家叫 Coefficient Bio 的AI生物技术公司,后者成立才8个月,团队只有约10人,专注于用AI加速新药研发。
两家公司,两个方向:OpenAI在赌AGI的时间节点,Anthropic在押生命科学的赛道。都是押注,只是押的方向不一样。
结语
4月14日的日期,现在等着就好。GPT-6要么如期来,要么推迟几天,要么参数和爆料有出入——这是常规操作。真正值得关注的,是它来了之后生产力工具会怎么被重新定义,以及哪些现在看起来“够用”的工作流会被迫升级。
那时候再来细聊。




发表回复