这周AI圈最戏剧性的一幕,不是某家公司发了什么新产品,而是一群开发者在OpenAI自己的后台日志里,把GPT-5.6给”抓”出来了。
5月26日,多位开发者发现,OpenAI Codex后端日志中赫然出现了一个从未官宣的模型条目——gpt-5.6,内部代号iris-alpha。更离谱的是,有人直接通过ChatGPT Pro的OAuth认证,成功在Codex环境中调用了这个模型。输入90万tokens的长文本,对答如流;塞进105万tokens,依然完美处理。
也就是说,GPT-5.5发布才三周,下一代模型的灰度测试已经在跑了。
这事放在平时已经够炸裂了。但当你把它跟前两周的局势串起来看,它就不是”一个模型的提前泄露”,而是OpenAI在四面受敌后被迫打出的第一张底牌。
两周内,OpenAI被围了一圈
先把时间拨回5月中旬。当时OpenAI的处境是这样的:
编程赛道,前后左右全是敌人。 Anthropic的Claude Code在企业市场疯狂攻城略地,今年4月企业应用率34.4%,三个月涨了3.8个百分点,同期OpenAI反而跌了2.9%。Google虽然在播客里罕见承认Gemini代理式编程落后竞品,但转头就在I/O上把Gemini Spark定位成24/7运行的系统级Agent,换了条路再战。微软Fara 1.5在浏览器Agent基准测试上72%的准确率直接碾压了OpenAI Operator的58.3%。xAI的Grok V9-Medium号称注入了Cursor真实工程数据,专攻编程。更不用提DeepSeek花700亿组建Code Harness团队,ACM金牌得主崔添翼亲自挂帅,摆明了要死磕这个赛道。
资本市场,对手步步紧逼。 Anthropic刚刚完成300亿美元融资,估值冲到9000亿,直接超越了OpenAI。OpenAI自己的保密IPO申请据传已经提交,目标估值8520亿——被一个成立才五年的公司压过一头,这面子往哪搁。
企业市场,价格战先打响了。 5月14日,Sam Altman突然宣布:未来30天内从其他平台切换到Codex的企业,免费使用2个月。宣布后3小时,2000名开发者报名。这操作被硅谷戏称为”AI版百亿补贴”——不是产品更好,而是先补贴把你拉过来再说。
Altman亲自下场搞促销,你什么时候见过这种事?
GPT-5.6到底有多狠
说回这次泄露的主角。
GPT-5.6不是GPT-5.5的小修小补。从开发者压测的结果来看,至少三个维度有质的提升:
第一,上下文窗口干到了150万tokens。 比GPT-5.5 API的105万提升了43%。关键是实际可用性——90万token输入下流畅响应,105万+请求完美处理,这是做了真刀真枪的工程优化,不是PPT数字。
第二,前端UI生成能力封神。 这也是开发者社区最炸裂的发现。科技博主Leo展示了GPT-5.6在几乎没有提示词的情况下,自动生成了一款名为”Lumen Notes”的极简笔记应用界面——成熟的网格布局、淡紫色调配色、清晰的字体层级和导航结构。前端圈的评价就四个字:去塑料感(de-slopification)。
要知道,AI写前端代码一直有个臭毛病——生成的UI像廉价模板,色彩艳俗、布局呆板。GPT-5.6在这件事上的进步,不是一个量变,是质变。10天前Leo还吐槽效果极差,一周后就天翻地覆。OpenAI在UI生成上的迭代速度,比它自己发新模型还快。
第三,推理架构底层重构。 开发者从模型元数据中发现,GPT-5.6同时挂着”x high”推理等级和”fast”极速模式标签。能把最高推理能力和极速响应两个互相矛盾的需求怼到一起,说明底层推理引擎做了深度重构,不是换个壳。
还有一个容易被忽略的信号:5月20日,OpenAI联合9位数学家发了一篇论文,宣布其推理模型自主推翻了一个悬了80年的Erdős平面单位距离猜想。菲尔兹奖得主Timothy Gowers背书”毫不犹豫推荐发表”。曾经揭穿过OpenAI前高管造假的数学家Thomas Bloom,这次也主动署名。
你品品这个时间线:数学论文5月20日发表,GPT-5.6的后端痕迹同一周被发现。社区普遍认为,这篇论文本质上就是GPT-5.6推理能力的”学术担保函”——它在告诉市场,我们的下一代模型不是靠概率续写出正确代码的,而是靠真正的逻辑推理。
泄露的不止GPT-5.6
更有意思的是,6月份要揭幕的不止OpenAI一家。
5月中旬,Anthropic工程师在向npm和Cargo推送Claude Code底层依赖更新时,误将未混淆的未发布分支代码打包了进去。虽然十几分钟后就紧急撤回覆盖了,但自动化爬虫已经把代码完整拖走了。
这份泄露的源码里藏着两个字符串:claude-mythos-1-preview和claude-4-8-sonnet-preview。Mythos是Anthropic一条全新产品线——通过Project Glasswing在政企代码库中挖出了上万个隐蔽漏洞,并配套了一个实时审计仪表盘。它的定位不是帮你写代码,而是帮你查代码,编码即审计。
Claude Sonnet 4.8则直接对标GPT-5.6,预计同为6月发布。有人甚至在Claude Code界面中短暂看到了Mythos-1的模型选项,截图后秒消失。
Google的Gemini 3.5 Pro也被推到了同一窗口。开发者根据Vertex AI的更新频率推测,6月大概率同步推出。xAI的Grok 5也在暗中蓄力。
这意味着什么?2026年6月,四家顶级AI公司的旗舰模型将在同一时间段内正面对撞。 GPT-5.6 vs Claude Sonnet 4.8 vs Gemini 3.5 Pro vs Grok 5——不是先后发布、各唱各的,而是扎堆硬刚。
硅谷一位资深架构师的警告一针见血:”三款最前沿的基座模型将在同一个月内发布。如果你的智能体底层框架被硬编码绑定在单一供应商身上,那么6月份你会感受到什么叫痛不欲生。”
补贴战背后的价格暗战
如果说模型是明面上的军备竞赛,那价格战就是暗地里的绞杀。
OpenAI的Codex免费2个月听着很香,但有个容易被忽略的前提——你得是从竞品切过来的,新用户不算。这不是”拉新”,这是精准挖墙脚。
Anthropic的应对更值得玩味。5月13日,Claude Code周使用限额提升了50%,覆盖Pro、Max、Team及企业用户。看起来是加量不加价,对吧?但同一时间,他们修改了Claude Agent SDK的调用方式,把自动化调用从订阅套餐里拆出来,单独套了个”程序化积分”体系。结果是什么?原先套餐内每月数千美元的可用额度,实际被砍到了200美元。
这不是加量,是明升暗降。超市免费试吃的经典套路:先让你吃上瘾,再换个更大的勺子——但是勺子变重了。
双方都在加速——OpenAI的模型迭代周期从GPT-3到GPT-4等了三年,从GPT-4到GPT-5等了一年多,现在呢?从GPT-5.5到GPT-5.6,压缩到了不到40天。这种节奏不是什么”研发效率提升”,是被围殴后的应激反应。
谁在逼OpenAI玩命?
这场反击战的深层逻辑其实很简单:OpenAI不能输掉AI编程这条赛道。
编程是AI商业化的最短路径。你让大模型写文章、画画、陪聊,变现路径又长又模糊。但你让它帮程序员写代码——这玩意直接省人力成本,ROI一目了然。Anthropic为什么能从OpenAI嘴里抢走企业市场份额?就是因为Claude Code在企业开发者中的口碑盖过了Codex。
更关键的是,Anthropic已经首次实现了季度盈利,Q2预计营收109亿人民币,利润5.59亿。OpenAI还在烧钱,对手已经开始赚钱了。IPO在即,华尔街看的不是你的论文发了多少篇,是你有没有可持续的商业模型。
别忘了,中国大模型的API调用量已经连续三周超过美国。DeepSeek V4-Pro永久降价75%,阿里发了Qwen 3.7-Max。整个市场在卷,OpenAI引以为傲的先发优势正在被迅速蚕食。
所以你看,GPT-5.6不是一个常规升级,是OpenAI在多重压力下的被迫出牌。Codex免费不是促销,是战略性亏损抢地盘。甚至连Altman亲自下场发推搞补贴这事本身——一个千亿估值公司的CEO,亲自给产品写促销文案——都透着一种”老子真的急了”的气息。
6月之后,开发者该怎么选
说实话,对普通开发者来说,这事其实挺简单的。
如果你是个人开发者,盯紧6月各家发布后的实际体验。谁的模型在真实项目中好用,用谁的。别被补贴绑死,也别被限额吓跑。现在这个阶段,忠诚是昂贵的——因为半年后格局可能又变了。
如果你在团队里做技术选型,硅谷那位架构师的警告值得反复琢磨:别把底层框架硬编码绑定在单一供应商身上。 6月份四家旗舰模型同时发布,刚好是评估和切换的时间窗口。抽象一层模型路由逻辑,成本不高,但能省掉未来的换模型成本。
如果你只是围观群众——那就更简单了。2026年6月,大概率是AI历史上模型密度最高的一个月。不管是”编程终局”还是”新的开始”,这个月的每一场发布会,都值得看。
本文基于以下信息源:IT之家5月26日报道、新智元5月25日报道、搜狐科技5月26日报道、51CTO 5月26日报道、腾讯新闻5月14日报道、网易科技5月26日报道,以及Anthropic/OpenAI官方开发者社区公开信息。




发表回复