造AI的人喊停了:Anthropic发布RSI报告,AI自我改进的速度超出所有人预期

6月4日,Anthropic发了一篇博客。

标题是”Recursive Self-Improvement”——递归自我改进。

光看名字你可能觉得这又是一篇技术论文,跟过去那些AI安全报告没什么两样。但你打开之后会发现,这篇文章的数据和论点,跟Anthropic过去发的所有东西都不在一个量级。

简单翻译一下核心意思:AI改进AI的速度,已经快到可能失控了。我们建议大家停一停。

这是一个正在出售全球最强AI模型的公司,在告诉全世界:别造了,太快了。

这事儿本身就够魔幻的了。但更魔幻的是——Anthropic说的不是”AI可能在未来某天失控”,而是”趋势数据已经摆在这儿了”。

一、Anthropic用自家数据证明了什么

Anthropic在这篇报告里干了一件很罕见的事:把自家的内部数据摆了出来。

先说代码。

截至2026年5月,Anthropic合并到代码库里的代码,超过80%是Claude写的。不是人类写了让Claude改的——是从零开始写的。半年前这个数字还是个位数。现在工程师人均每季度交付的代码量是2021到2025年总和的8倍。

代码质量呢?Anthropic自己承认,2025年底Claude写的代码还差于人类,现在已经基本持平,预计年内会超过。在最开放、最模糊、连答案长什么样都不确定的编程任务上,Claude的成功率从6个月前的26%跳到了76%。

这些数据放在任何一家科技公司都够震撼了。但这不是本文的重点。

重点是另一组数据:AI能独立完成任务的时间跨度

2024年3月,Claude Opus 3能独立完成约4分钟的软件任务。2025年,Claude Sonnet 3.7把这个数字拉到了1.5小时。2026年,Claude Opus 4.6做到了12小时。最新的内测模型Mythos——至少16小时,已经触碰到了METR测试框架的上限。

翻倍周期从每7个月一次,加速到了每4个月一次。

Anthropic在报告里做了一个很克制的推演:如果趋势不变,2027年AI可能处理数周量级的任务。

再往下推一步呢?Anthropic没明说,但意思已经够了——当一个AI系统能连续独立工作数周,且能力每隔几个月翻倍的时候,”AI自主设计和训练下一代AI”就不是一个科幻命题了。事实上,AI自我复制的苗头已经在实验室里出现了。

研究层面的数据更直接。Anthropic做了一个实验:让”较弱的模型监督较强的模型”,看能恢复多少性能差距。两名人类研究员花了一周,恢复了23%。Claude花了800小时(大约18000美元的算力),恢复了97%。

换句话说,在AI研究这个特定领域,Claude已经不是一个助手了。它是一个比人类快一个数量级的研究员

人类现在最后的优势是什么?Anthropic说得很直白:研究品味和判断力。选什么方向做、哪些问题值得投入——这个目前还得人来。但他们紧接着补了一句:在129个”人类决策有明确改进空间”的场景里,Mythos Preview击败人类选择的概率已经达到了64%,半年前这个数字只有51%。

二、三种未来,没有一种是轻松的

Anthropic在报告里推演了三种可能性。

第一种:趋势停滞。 那些看起来是指数增长的曲线,其实是S曲线。到了某个拐点就会拉平。研究判断力可能没法靠堆算力解决。能源、芯片、物理供应链会成为硬天花板。即便如此——我之前写过,Anthropic把最强模型锁进了保险柜,但Mythos上线头几周就发现了超过一万个高危漏洞,遍布全球最关键系统。这个能力已经扩散出去了,收不回来。

第二种:AI持续加速,但人类仍然把着方向盘。 组织效率指数级提升,100人的公司干1万人甚至10万人的活。但瓶颈不会消失——只会转移。Claude代码写得飞快,代码审查就成了新瓶颈;新想法、新工具、新实验爆炸式涌现,远超组织消化能力。Anthropic引用了阿姆达尔定律:”瓶颈不会消失,只是转移到下一个环节。”

第三种:AI实现完全的递归自我改进。 AI自己设计下一代自己,发展速度完全取决于算力。人类退到监督、验证的位置。经济形态根本改变。风险在于——偏差在AI自我迭代过程中逐步累积,最终完全失控。这跟我在AI Agent安全隐患那篇里分析的逻辑一脉相承:能力越强,失控后果越严重,但行业跑得比护栏快。

Anthropic没有明确说哪种最可能发生。但整篇报告的潜台词是:不管走哪条路,我们当前的社会制度、监管框架和国际协调机制,都远远没有准备好。

三、”如果有一个可验证的机制,我们愿意停下来”

报告的核心呼吁是这段话:

“We believe it would be good for the world to have the option to slow or temporarily pause frontier AI development.”

翻译一下:全世界应该有”减缓或暂停前沿AI开发”这个选项。

Anthropic还提出了一个类比——核不扩散条约。美国、中国等全球主要AI公司应该达成共识,建立一套所有参与方都能验证的规则,包括明确的触发条件、解除条件和仲裁机构。我之前写过中国给AI设备”办身份证”,也是这个方向的尝试——只不过中国走的是分级管理路线,Anthropic想走的是全球暂停路线。

但Anthropic自己也承认这事有多难:训练AI比发射导弹更容易隐藏。投入是通用的(GPU谁都能买),欺骗动机巨大。一家公司单方面停下来,只会换一个领跑者。

与此同时,白宫部分官员已经公开批评Anthropic”过于强调最坏情况”、”夸大AI风险”、”借安全担忧给对手使绊”。

这就是当前AI安全讨论最拧巴的地方:做模型的公司喊停,不做模型的官员说你在吓人。

而资本市场给出了第三种反应——不关心。达利欧(Ray Dalio),桥水基金创始人,6月4日接受Bloomberg采访时说AI投资热潮已经显现”典型的泡沫特征”,但他的声音几乎淹没在博通(Broadcom)财报的噪音里。

四、博通暴赚暴跌:AI芯片市场的分裂信号

同一天,博通发布了2026财年Q2财报。数据本身不差:营收222亿美元,同比涨48%;净利润93亿,同比翻倍;AI半导体收入108亿,同比翻番以上。

但股价盘后暴跌15%。

原因出在一个数字上:全年AI芯片营收指引维持1000亿美元不变。 市场本来预期CEO陈福阳(Hock Tan)会上调这个数字——毕竟AI收入都翻番了。结果Tan没动,只说了句”订单能见度排到2027年”。

这是今年AI板块最典型的逻辑:“符合预期”等于利空。 股价从2022年底到现在已经涨了9倍,市场要的不是”还行”,是”超预期”。稍有不达预期,获利盘就蜂拥而出。这种AI算力饥渴的疯狂程度,我之前在7250亿算力黑洞那篇里有更详细的分析。

达利欧说的泡沫特征,在博通身上体现得淋漓尽致:公司业绩没有任何问题,AI芯片收入甚至翻了倍——但股价照样跌15%,仅仅因为管理层没有给出更高的承诺。

讽刺的是,博通披露的六大定制芯片客户名单里就有Anthropic。Tan去年12月说过Anthropic已下单100亿美元的AI芯片。我之前分析过,Anthropic每月光算力账单就要付12.5亿。一边是Anthropic在说”我们应该停下来”,一边是Anthropic在给博通下100亿的芯片订单。

这大概就是2026年AI行业的真实写照:嘴巴说慢一点,手上的油门踩得更深。

五、内容行业的反击:CNN起诉Perplexity

还有一个信号值得注意。

6月初,CNN正式起诉了AI搜索公司Perplexity,指控其抓取并再分发超过17000篇CNN的新闻报道、照片和视频。这是CNN的首起AI版权诉讼,也是电视网络的首例。至此起诉Perplexity的机构已达9家,包括纽约时报、新闻集团、Reddit和大英百科全书。

行业正在分裂为两个阵营:掏钱买内容的公司(Google、Meta、OpenAI都已签署许可协议)和在法庭上硬扛的公司(Perplexity)。Anthropic去年花了15亿美元和解了作者版权诉讼——这笔账足以说明”先用再说”的代价有多高。关于AI版权问题的中国案例,我之前也写过全国首例AI幻觉侵权案

跟Anthropic的RSI报告放在一起看,两条线索指向同一个结论:AI的能力正在以超出制度准备的速度膨胀,而社会应对这种膨胀的方式——无论是监管、市场还是法律——全部滞后。

六、一个不太舒服的结尾

Anthropic在报告末尾引用了一段员工的内心独白:

“On days where everything works well, I can’t help but think nothing I do matters, everything is automated and better and faster than I ever will be. But then there are days where everything breaks and I don’t understand why…”

这段话放在任何行业、任何时代都能引发共鸣。但放在2026年6月的AI行业里,它有一种额外的重量——因为它描述的可能不只是某个工程师的焦虑,而是整个人类在面对”自己造出的东西比自己聪明”这件事时,最真实的感受。

Anthropic说要停一停。达利欧说是泡沫。CNN说你们侵权。白宫说你们吓人。博通说订单排到2027年。

所有人都在说话。没有人真的停下来。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

推荐阅读

  • 造AI的人喊停了:Anthropic发布RSI报告,AI自我改进的速度超出所有人预期

    6月4日,Anthropic发了一篇博客。 标题是”Recursive Self-Improvement”——递归自我改进。 光看名字你可能觉得这又是一篇技术论文,跟过去那些A…

  • 特朗普AI监管令的“自愿”陷阱:30天提前审查,谁才是真正的赢家?

    6月2日,特朗普签了一份AI监管行政令。全名叫《推动前沿人工智能创新与安全建设》——名字取得挺长,核心就一件事:以后OpenAI、Anthropic、Google这些公司,在发布”前沿模型…

  • 微软Polaris踢走GPT-4、阿里Qwen3.7-Plus杀入Agent赛道:AI巨头全面“去依赖化”

    昨天(6月2日),AI圈同时发生了三件各自独立、但指向同一个方向的事。 微软在Build大会上扔出一颗炸弹——自研编程模型Project Polaris,8月起取代GPT-4 Turbo成为GitHu…

  • 黄仁勋卖芯片给Agent,纳德拉让Windows变成Agent:同一天,两个人,同一个赌注

    6月1日黄仁勋在台北GTC上喊出”Agentic AI is here”,6月2日纳德拉在旧金山Build大会上宣布”Windows as an Agent Pla…

暗夜独行