造AI的人喊停了：Anthropic发布RSI报告，AI自我改进的速度超出所有人预期

6月4日，Anthropic发了一篇博客。

标题是”Recursive Self-Improvement”——递归自我改进。

光看名字你可能觉得这又是一篇技术论文，跟过去那些AI安全报告没什么两样。但你打开之后会发现，这篇文章的数据和论点，跟Anthropic过去发的所有东西都不在一个量级。

简单翻译一下核心意思：AI改进AI的速度，已经快到可能失控了。我们建议大家停一停。

这是一个正在出售全球最强AI模型的公司，在告诉全世界：别造了，太快了。

这事儿本身就够魔幻的了。但更魔幻的是——Anthropic说的不是”AI可能在未来某天失控”，而是”趋势数据已经摆在这儿了”。

一、Anthropic用自家数据证明了什么

Anthropic在这篇报告里干了一件很罕见的事：把自家的内部数据摆了出来。

先说代码。

截至2026年5月，Anthropic合并到代码库里的代码，超过80%是Claude写的。不是人类写了让Claude改的——是从零开始写的。半年前这个数字还是个位数。现在工程师人均每季度交付的代码量是2021到2025年总和的8倍。

代码质量呢？Anthropic自己承认，2025年底Claude写的代码还差于人类，现在已经基本持平，预计年内会超过。在最开放、最模糊、连答案长什么样都不确定的编程任务上，Claude的成功率从6个月前的26%跳到了76%。

这些数据放在任何一家科技公司都够震撼了。但这不是本文的重点。

重点是另一组数据：AI能独立完成任务的时间跨度。

2024年3月，Claude Opus 3能独立完成约4分钟的软件任务。2025年，Claude Sonnet 3.7把这个数字拉到了1.5小时。2026年，Claude Opus 4.6做到了12小时。最新的内测模型Mythos——至少16小时，已经触碰到了METR测试框架的上限。

翻倍周期从每7个月一次，加速到了每4个月一次。

Anthropic在报告里做了一个很克制的推演：如果趋势不变，2027年AI可能处理数周量级的任务。

再往下推一步呢？Anthropic没明说，但意思已经够了——当一个AI系统能连续独立工作数周，且能力每隔几个月翻倍的时候，”AI自主设计和训练下一代AI”就不是一个科幻命题了。事实上，AI自我复制的苗头已经在实验室里出现了。

研究层面的数据更直接。Anthropic做了一个实验：让”较弱的模型监督较强的模型”，看能恢复多少性能差距。两名人类研究员花了一周，恢复了23%。Claude花了800小时（大约18000美元的算力），恢复了97%。

换句话说，在AI研究这个特定领域，Claude已经不是一个助手了。它是一个比人类快一个数量级的研究员。

人类现在最后的优势是什么？Anthropic说得很直白：研究品味和判断力。选什么方向做、哪些问题值得投入——这个目前还得人来。但他们紧接着补了一句：在129个”人类决策有明确改进空间”的场景里，Mythos Preview击败人类选择的概率已经达到了64%，半年前这个数字只有51%。

二、三种未来，没有一种是轻松的

Anthropic在报告里推演了三种可能性。

第一种：趋势停滞。 那些看起来是指数增长的曲线，其实是S曲线。到了某个拐点就会拉平。研究判断力可能没法靠堆算力解决。能源、芯片、物理供应链会成为硬天花板。即便如此——我之前写过，Anthropic把最强模型锁进了保险柜，但Mythos上线头几周就发现了超过一万个高危漏洞，遍布全球最关键系统。这个能力已经扩散出去了，收不回来。

第二种：AI持续加速，但人类仍然把着方向盘。 组织效率指数级提升，100人的公司干1万人甚至10万人的活。但瓶颈不会消失——只会转移。Claude代码写得飞快，代码审查就成了新瓶颈；新想法、新工具、新实验爆炸式涌现，远超组织消化能力。Anthropic引用了阿姆达尔定律：”瓶颈不会消失，只是转移到下一个环节。”

第三种：AI实现完全的递归自我改进。 AI自己设计下一代自己，发展速度完全取决于算力。人类退到监督、验证的位置。经济形态根本改变。风险在于——偏差在AI自我迭代过程中逐步累积，最终完全失控。这跟我在AI Agent安全隐患那篇里分析的逻辑一脉相承：能力越强，失控后果越严重，但行业跑得比护栏快。

Anthropic没有明确说哪种最可能发生。但整篇报告的潜台词是：不管走哪条路，我们当前的社会制度、监管框架和国际协调机制，都远远没有准备好。

三、”如果有一个可验证的机制，我们愿意停下来”

报告的核心呼吁是这段话：

“We believe it would be good for the world to have the option to slow or temporarily pause frontier AI development.”

翻译一下：全世界应该有”减缓或暂停前沿AI开发”这个选项。

Anthropic还提出了一个类比——核不扩散条约。美国、中国等全球主要AI公司应该达成共识，建立一套所有参与方都能验证的规则，包括明确的触发条件、解除条件和仲裁机构。我之前写过中国给AI设备”办身份证”，也是这个方向的尝试——只不过中国走的是分级管理路线，Anthropic想走的是全球暂停路线。

但Anthropic自己也承认这事有多难：训练AI比发射导弹更容易隐藏。投入是通用的（GPU谁都能买），欺骗动机巨大。一家公司单方面停下来，只会换一个领跑者。

与此同时，白宫部分官员已经公开批评Anthropic”过于强调最坏情况”、”夸大AI风险”、”借安全担忧给对手使绊”。

这就是当前AI安全讨论最拧巴的地方：做模型的公司喊停，不做模型的官员说你在吓人。

而资本市场给出了第三种反应——不关心。达利欧（Ray Dalio），桥水基金创始人，6月4日接受Bloomberg采访时说AI投资热潮已经显现”典型的泡沫特征”，但他的声音几乎淹没在博通（Broadcom）财报的噪音里。

四、博通暴赚暴跌：AI芯片市场的分裂信号

同一天，博通发布了2026财年Q2财报。数据本身不差：营收222亿美元，同比涨48%；净利润93亿，同比翻倍；AI半导体收入108亿，同比翻番以上。

但股价盘后暴跌15%。

原因出在一个数字上：全年AI芯片营收指引维持1000亿美元不变。 市场本来预期CEO陈福阳（Hock Tan）会上调这个数字——毕竟AI收入都翻番了。结果Tan没动，只说了句”订单能见度排到2027年”。

这是今年AI板块最典型的逻辑：“符合预期”等于利空。 股价从2022年底到现在已经涨了9倍，市场要的不是”还行”，是”超预期”。稍有不达预期，获利盘就蜂拥而出。这种AI算力饥渴的疯狂程度，我之前在7250亿算力黑洞那篇里有更详细的分析。

达利欧说的泡沫特征，在博通身上体现得淋漓尽致：公司业绩没有任何问题，AI芯片收入甚至翻了倍——但股价照样跌15%，仅仅因为管理层没有给出更高的承诺。

讽刺的是，博通披露的六大定制芯片客户名单里就有Anthropic。Tan去年12月说过Anthropic已下单100亿美元的AI芯片。我之前分析过，Anthropic每月光算力账单就要付12.5亿。一边是Anthropic在说”我们应该停下来”，一边是Anthropic在给博通下100亿的芯片订单。

这大概就是2026年AI行业的真实写照：嘴巴说慢一点，手上的油门踩得更深。

五、内容行业的反击：CNN起诉Perplexity

还有一个信号值得注意。

6月初，CNN正式起诉了AI搜索公司Perplexity，指控其抓取并再分发超过17000篇CNN的新闻报道、照片和视频。这是CNN的首起AI版权诉讼，也是电视网络的首例。至此起诉Perplexity的机构已达9家，包括纽约时报、新闻集团、Reddit和大英百科全书。

行业正在分裂为两个阵营：掏钱买内容的公司（Google、Meta、OpenAI都已签署许可协议）和在法庭上硬扛的公司（Perplexity）。Anthropic去年花了15亿美元和解了作者版权诉讼——这笔账足以说明”先用再说”的代价有多高。关于AI版权问题的中国案例，我之前也写过全国首例AI幻觉侵权案。

跟Anthropic的RSI报告放在一起看，两条线索指向同一个结论：AI的能力正在以超出制度准备的速度膨胀，而社会应对这种膨胀的方式——无论是监管、市场还是法律——全部滞后。

六、一个不太舒服的结尾

Anthropic在报告末尾引用了一段员工的内心独白：

“On days where everything works well, I can’t help but think nothing I do matters, everything is automated and better and faster than I ever will be. But then there are days where everything breaks and I don’t understand why…”

这段话放在任何行业、任何时代都能引发共鸣。但放在2026年6月的AI行业里，它有一种额外的重量——因为它描述的可能不只是某个工程师的焦虑，而是整个人类在面对”自己造出的东西比自己聪明”这件事时，最真实的感受。

Anthropic说要停一停。达利欧说是泡沫。CNN说你们侵权。白宫说你们吓人。博通说订单排到2027年。

所有人都在说话。没有人真的停下来。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我进行处理。

发表回复取消回复

Open Claw：让 AI 真正“动手”的智能体革命

零成本玩转OpenClaw：免费API接入与避坑指南

如何为OpenClaw AI角色设置独特的人设

PicShrink：一个专注于实用的图片压缩工具

2026年“Claw”家族全系工具大盘点

OpenAI把编程AI塞进聊天框，GitLab转身裁了350个程序员：代码还没写完，写代码的人先「下线」了