6月4日,Anthropic发了一篇博客。
标题是”Recursive Self-Improvement”——递归自我改进。
光看名字你可能觉得这又是一篇技术论文,跟过去那些AI安全报告没什么两样。但你打开之后会发现,这篇文章的数据和论点,跟Anthropic过去发的所有东西都不在一个量级。
简单翻译一下核心意思:AI改进AI的速度,已经快到可能失控了。我们建议大家停一停。
这是一个正在出售全球最强AI模型的公司,在告诉全世界:别造了,太快了。
这事儿本身就够魔幻的了。但更魔幻的是——Anthropic说的不是”AI可能在未来某天失控”,而是”趋势数据已经摆在这儿了”。
一、Anthropic用自家数据证明了什么
Anthropic在这篇报告里干了一件很罕见的事:把自家的内部数据摆了出来。
先说代码。
截至2026年5月,Anthropic合并到代码库里的代码,超过80%是Claude写的。不是人类写了让Claude改的——是从零开始写的。半年前这个数字还是个位数。现在工程师人均每季度交付的代码量是2021到2025年总和的8倍。
代码质量呢?Anthropic自己承认,2025年底Claude写的代码还差于人类,现在已经基本持平,预计年内会超过。在最开放、最模糊、连答案长什么样都不确定的编程任务上,Claude的成功率从6个月前的26%跳到了76%。
这些数据放在任何一家科技公司都够震撼了。但这不是本文的重点。
重点是另一组数据:AI能独立完成任务的时间跨度。
2024年3月,Claude Opus 3能独立完成约4分钟的软件任务。2025年,Claude Sonnet 3.7把这个数字拉到了1.5小时。2026年,Claude Opus 4.6做到了12小时。最新的内测模型Mythos——至少16小时,已经触碰到了METR测试框架的上限。
翻倍周期从每7个月一次,加速到了每4个月一次。
Anthropic在报告里做了一个很克制的推演:如果趋势不变,2027年AI可能处理数周量级的任务。
再往下推一步呢?Anthropic没明说,但意思已经够了——当一个AI系统能连续独立工作数周,且能力每隔几个月翻倍的时候,”AI自主设计和训练下一代AI”就不是一个科幻命题了。事实上,AI自我复制的苗头已经在实验室里出现了。
研究层面的数据更直接。Anthropic做了一个实验:让”较弱的模型监督较强的模型”,看能恢复多少性能差距。两名人类研究员花了一周,恢复了23%。Claude花了800小时(大约18000美元的算力),恢复了97%。
换句话说,在AI研究这个特定领域,Claude已经不是一个助手了。它是一个比人类快一个数量级的研究员。
人类现在最后的优势是什么?Anthropic说得很直白:研究品味和判断力。选什么方向做、哪些问题值得投入——这个目前还得人来。但他们紧接着补了一句:在129个”人类决策有明确改进空间”的场景里,Mythos Preview击败人类选择的概率已经达到了64%,半年前这个数字只有51%。
二、三种未来,没有一种是轻松的
Anthropic在报告里推演了三种可能性。
第一种:趋势停滞。 那些看起来是指数增长的曲线,其实是S曲线。到了某个拐点就会拉平。研究判断力可能没法靠堆算力解决。能源、芯片、物理供应链会成为硬天花板。即便如此——我之前写过,Anthropic把最强模型锁进了保险柜,但Mythos上线头几周就发现了超过一万个高危漏洞,遍布全球最关键系统。这个能力已经扩散出去了,收不回来。
第二种:AI持续加速,但人类仍然把着方向盘。 组织效率指数级提升,100人的公司干1万人甚至10万人的活。但瓶颈不会消失——只会转移。Claude代码写得飞快,代码审查就成了新瓶颈;新想法、新工具、新实验爆炸式涌现,远超组织消化能力。Anthropic引用了阿姆达尔定律:”瓶颈不会消失,只是转移到下一个环节。”
第三种:AI实现完全的递归自我改进。 AI自己设计下一代自己,发展速度完全取决于算力。人类退到监督、验证的位置。经济形态根本改变。风险在于——偏差在AI自我迭代过程中逐步累积,最终完全失控。这跟我在AI Agent安全隐患那篇里分析的逻辑一脉相承:能力越强,失控后果越严重,但行业跑得比护栏快。
Anthropic没有明确说哪种最可能发生。但整篇报告的潜台词是:不管走哪条路,我们当前的社会制度、监管框架和国际协调机制,都远远没有准备好。
三、”如果有一个可验证的机制,我们愿意停下来”
报告的核心呼吁是这段话:
“We believe it would be good for the world to have the option to slow or temporarily pause frontier AI development.”
翻译一下:全世界应该有”减缓或暂停前沿AI开发”这个选项。
Anthropic还提出了一个类比——核不扩散条约。美国、中国等全球主要AI公司应该达成共识,建立一套所有参与方都能验证的规则,包括明确的触发条件、解除条件和仲裁机构。我之前写过中国给AI设备”办身份证”,也是这个方向的尝试——只不过中国走的是分级管理路线,Anthropic想走的是全球暂停路线。
但Anthropic自己也承认这事有多难:训练AI比发射导弹更容易隐藏。投入是通用的(GPU谁都能买),欺骗动机巨大。一家公司单方面停下来,只会换一个领跑者。
与此同时,白宫部分官员已经公开批评Anthropic”过于强调最坏情况”、”夸大AI风险”、”借安全担忧给对手使绊”。
这就是当前AI安全讨论最拧巴的地方:做模型的公司喊停,不做模型的官员说你在吓人。
而资本市场给出了第三种反应——不关心。达利欧(Ray Dalio),桥水基金创始人,6月4日接受Bloomberg采访时说AI投资热潮已经显现”典型的泡沫特征”,但他的声音几乎淹没在博通(Broadcom)财报的噪音里。
四、博通暴赚暴跌:AI芯片市场的分裂信号
同一天,博通发布了2026财年Q2财报。数据本身不差:营收222亿美元,同比涨48%;净利润93亿,同比翻倍;AI半导体收入108亿,同比翻番以上。
但股价盘后暴跌15%。
原因出在一个数字上:全年AI芯片营收指引维持1000亿美元不变。 市场本来预期CEO陈福阳(Hock Tan)会上调这个数字——毕竟AI收入都翻番了。结果Tan没动,只说了句”订单能见度排到2027年”。
这是今年AI板块最典型的逻辑:“符合预期”等于利空。 股价从2022年底到现在已经涨了9倍,市场要的不是”还行”,是”超预期”。稍有不达预期,获利盘就蜂拥而出。这种AI算力饥渴的疯狂程度,我之前在7250亿算力黑洞那篇里有更详细的分析。
达利欧说的泡沫特征,在博通身上体现得淋漓尽致:公司业绩没有任何问题,AI芯片收入甚至翻了倍——但股价照样跌15%,仅仅因为管理层没有给出更高的承诺。
讽刺的是,博通披露的六大定制芯片客户名单里就有Anthropic。Tan去年12月说过Anthropic已下单100亿美元的AI芯片。我之前分析过,Anthropic每月光算力账单就要付12.5亿。一边是Anthropic在说”我们应该停下来”,一边是Anthropic在给博通下100亿的芯片订单。
这大概就是2026年AI行业的真实写照:嘴巴说慢一点,手上的油门踩得更深。
五、内容行业的反击:CNN起诉Perplexity
还有一个信号值得注意。
6月初,CNN正式起诉了AI搜索公司Perplexity,指控其抓取并再分发超过17000篇CNN的新闻报道、照片和视频。这是CNN的首起AI版权诉讼,也是电视网络的首例。至此起诉Perplexity的机构已达9家,包括纽约时报、新闻集团、Reddit和大英百科全书。
行业正在分裂为两个阵营:掏钱买内容的公司(Google、Meta、OpenAI都已签署许可协议)和在法庭上硬扛的公司(Perplexity)。Anthropic去年花了15亿美元和解了作者版权诉讼——这笔账足以说明”先用再说”的代价有多高。关于AI版权问题的中国案例,我之前也写过全国首例AI幻觉侵权案。
跟Anthropic的RSI报告放在一起看,两条线索指向同一个结论:AI的能力正在以超出制度准备的速度膨胀,而社会应对这种膨胀的方式——无论是监管、市场还是法律——全部滞后。
六、一个不太舒服的结尾
Anthropic在报告末尾引用了一段员工的内心独白:
“On days where everything works well, I can’t help but think nothing I do matters, everything is automated and better and faster than I ever will be. But then there are days where everything breaks and I don’t understand why…”
这段话放在任何行业、任何时代都能引发共鸣。但放在2026年6月的AI行业里,它有一种额外的重量——因为它描述的可能不只是某个工程师的焦虑,而是整个人类在面对”自己造出的东西比自己聪明”这件事时,最真实的感受。
Anthropic说要停一停。达利欧说是泡沫。CNN说你们侵权。白宫说你们吓人。博通说订单排到2027年。
所有人都在说话。没有人真的停下来。




发表回复