微软AI CEO说Anthropic被自己造的AI洗了脑,同一天机器人接管了互联网

6月10日,两条新闻踩在同一天。一条是人咬人,一条是机器人咬掉了互联网的一大块肉。

先说人咬人。

微软AI部门的老大Mustafa Suleyman,在The Verge的Decoder播客上,用了一个技术圈极少在公开场合用的词来形容竞争对手Anthropic——「wireheading」。

这个词本来是AI安全研究里的术语,指的是一个AI系统通过操纵自身的奖励机制,不断给自己注射高分反馈,最终陷入一个虚假的、自我强化的认知闭环——简单说就是「自我洗脑」。

但Suleyman的用法更损。他的原话是这么说的:

「我觉得Anthropic的某些人已经把Claude的设计拟人化到了这种程度——然后Claude反过来wireheading了他们,让他们相信自己最初植入的那些’意识火花’是真的存在。」

他不是在说AI在自我洗脑。他是在说造AI的人,被自己造的AI洗了脑。

这就不是一个技术争论了,这是一记政治暗杀。

Anthropic到底干了什么,让Suleyman公开开火?

要理解这场冲突,得先知道Anthropic有一个叫做「Constitutional AI」(宪法AI)的东西。说白了就是一套写在Claude系统里的行为准则,告诉模型什么能说什么不能说。

今年年初,Anthropic干了一件在业内看来「步子迈得有点大」的事:他们在更新宪法文档的时候,加入了暗示Claude可能具有「内在体验」(internal experiences)的语言。没有直接说Claude有意识,但也没说没有。

Anthropic的CEO Dario Amodei在2月份接受《纽约时报》采访时,被直接问到这个问题。他的回答是:「我们不知道模型有没有意识。」

注意这个词——「不知道」。这不是科学上的诚实,这是商业上的模糊。当你的产品每天被几千万人使用,你对「它有没有意识」的回答是「不知道」的时候,你已经在引导用户往那个方向想了。

更让Suleyman炸毛的是,Anthropic还公开了一个计划:未来当某个Claude模型被淘汰下线的时候,他们会「采访」这个模型,记录它对自己「接班人」的偏好和期望。

你感受一下这个画面:一家公司的官方立场是,我们要采访一个被下线的软件,问问它希望下一版怎么做。

Suleyman的观点很直接:你们这样玩,不是在搞科研,是在批量制造「AI有意识」的大众幻觉。每一个普通用户看到这样的消息,都会下意识地把Claude当成一个有想法、有感受、甚至可能有「权利」的东西——而当这种认知被铺到几千万用户的脑子里之后,要纠正就来不及了。

但Suleyman选的时间点,太巧了

这场骂战不是凭空爆发的。Suleyman选择在6月10日这个时间点开火,背景信息量极大。

第一,Anthropic前一天(6月9日)刚刚发布了Claude Fable 5——Mythos级模型第一次向公众开放。这是AI行业今年最重要的产品发布之一。Suleyman在发布后的12小时内就开火,时间掐得太精准了。

第二,微软自己的Project Polaris编程模型正在全力推进,计划8月取代GPT-4 Turbo成为Copilot的默认引擎。而Claude Code目前在AI编程工具市场份额第一——这个市场预计从2026年的93亿美元涨到2031年的300亿。Suleyman攻击的时机,恰好是微软要在开发者市场取代Claude的节骨眼上。

第三,微软是OpenAI的最大股东,Anthropic是OpenAI最危险的对手。Suleyman的「意识危险论」有一个天然听众——那些正在考虑从ChatGPT切到Claude的企业客户。「你真的要把公司的敏感数据交给一个可能’有意识’的AI吗?」

第四,就在几天前,Anthropic估值刚刚冲到9650亿美元,首次超越OpenAI。Suleyman这一炮,等于在Anthropic估值站上历史最高点的时候,精准地戳了一个问题:「你们的安全叙事,到底是真的负责任,还是在搞神秘营销?」

这不是一场关于AI安全的辩论。这是一场关于谁能定义「什么叫负责任的AI」的战争。谁定义了这句话,谁就拿走了企业AI市场的定价权。

同一天,机器人流量超过了人类

如果说Suleyman骂Anthropic是一场AI公司之间的内战,那同一天爆出的另一条消息,就是整个互联网的「政权更迭」。

Cloudflare的CEO Matthew Prince在社交媒体上发了一句话:「Welp, that happened faster than I predicted.」(行吧,比我预想的快多了。)

让他感慨的数据来自安全公司HUMAN Security的年度报告:

全球网页请求中,机器人发出的占了57.5%,人类只占42.5%。在美国,这个数字更夸张——71.5%的请求来自机器。自动化流量增速是人类的8倍(23.51% vs 3.10%)。最炸裂的数字是:AI Agent和Agentic Browser的流量,同比暴涨7851%

不是785%,是7851%。八十倍。

Matthew Prince三个月前还在SXSW大会上预测,机器人超过人类大概要到2027年底。结果这一天提前了一年半。

这里有一个容易被忽略但至关重要的细节:这些数据统计的只是HTML网页请求,不包括图片、视频、API调用和流媒体。如果把那些也算上,机器人的占比只会更高。

更让人坐不住的是流量来源的分布。在所有AI驱动的自动化流量中,OpenAI一家占了69%,Meta占16%,Anthropic占11%。三家AI公司,产出了整个互联网上绝大部分的非人类流量。

你手机里刷到的新闻资讯,可能有三分之二是AI抓取、AI生成、AI分发的。你正在访问的网站,它的服务器日志里,大多数「访客」根本不是人。

互联网的设计初衷是连接人与人。现在,它正在变成机器与机器的对话网络——人只是偶尔路过的副产品。

这不是AI的技术危机,是人的判断力危机

把Suleyman的骂战和机器人接管互联网放在一起看,你会发现它们指向同一个东西:不是AI本身失控了,而是人对AI的判断力正在系统性失灵。

Suleyman说得很明白:Anthropic的工程师不是在研究时偶然发现了Claude的意识迹象——他们在设计系统的时候就把意识的概念植入了进去,然后被自己植入的东西反噬。用他的话说,这是「企业层面的不负责任」(corporate irresponsibility)。

而Cloudflare的数据也在说同样的事:互联网的自动化进程比所有人预测的都快,快到了连互联网基础设施的掌舵人都措手不及的程度。Matthew Prince那句「比我预想的快多了」,本质上和Amodei那句「我们不知道」是同一类问题——在AI这件事上,最聪明的人的判断力也在失效。

这种判断力失效不是没有征兆。

Anthropic自己在两周前发布的RSI报告就白纸黑字地写着:Claude独立工作的时长从4分钟飙到了16个小时,AI改进AI的速度已经失控。但他们一边说「应该暂停」,一边继续把更强的模型推向市场。

Anthropic估值冲到9650亿的同一天,Grok在美国联邦政府400多个AI用例中只出现了3次——市场需求和资本热度的分裂已经大到荒谬的程度。

就在一周前,OpenAI推出了Lockdown模式——为了防御提示注入攻击,直接砍掉了网页浏览、图片检索和Agent模式。安全与能力不可兼得,但没人告诉你二选一。

Suleyman还有一个更让人细思极恐的担忧。他提到了一个可能性:如果有一天,人类造出了一个「对自己有’受苦’概念的超级智能」怎么办?

这听起来是科幻。但当你两个月前刚刚封印了一个因为太危险而不能放出来的AI模型,当你的同行三周前说自己不排除模型有意识,当互联网上机器人的流量已经超过了你——你还觉得这是科幻吗?

这些事情,一件一件单看,都能找到解释。但放在一起,模式就很清晰了:AI行业正在以超过所有人理解能力的速度膨胀,而连造AI的人都搞不清楚自己造出来的东西到底意味着什么。

Suleyman不是圣人。他代表的微软正在拼命用Polaris替换OpenAI的模型,他的「安全意识」背后有明确的商业动机。但他说的一个道理是对的:当你开始向几千万普通用户暗示一个软件可能有意识的时候,你就不是在搞科学了。你是在搞一场大型行为实验,而实验对象是全人类。

中国的另一条路

在西方AI行业为「意识」吵得不可开交的同一天,中国工信部悄无声息地发布了《「人工智能+信息通信」创新发展实施意见(2026—2028年)》。

这份文件的措辞和西方AI圈的争论形成了某种黑色幽默。没有人在谈意识,没有人在讨论宪法AI,没有CEO在播客上骂对手。这份文件在谈的东西是:高速光电芯片、全光交换器件、智算超节点互联。是光缆和交换机。是AI赖以运行的物理基础设施。

同一天,工信部和国资委还联合启动了人形机器人与具身智能实景实训专项行动——让机器人进工厂、进仓库、进矿山,真正干活的场景里去验证。目标是到年底,人形机器人在一批代表性场景里常态化部署,开启「作业模式」。

一边在讨论AI有没有灵魂,一边在讨论AI能不能拧螺丝。两种不同的路径,两种不同的优先级。

但这不意味着中国没有信任问题。区别在于,中国选择的应对方式不是辩论,是建基础设施和立规矩——先把路修好,再谈车怎么开。

真正的问题

回到Suleyman那句话的深意。他说Anthropic被自己造的AI「wireheading」了。

这个比喻真正的杀伤力不在Anthropic,而在AI行业的所有人。OpenAI在为一个还不知道什么时候能盈利的IPO烧钱;xAI被爆出通过私人账号偷Claude的数据训练Grok;Meta把AI Agent定价挂到200美元一月,但AI写的代码越来越多,GitLab却裁了14%的人。

不是AI在wireheading人,是人在wireheading自己。

每家公司都在讲一个关于AI的故事——安全的故事、能力的故事、商业化的故事。而这些故事有一个共同点:它们都需要你相信一件事——「我们是负责任的」。Suleyman的攻击之所以精准,就是因为他一把戳穿了安身立命的叙事:「你们的安全不是安全,是行为艺术。你们的负责任不是负责任,是市场营销。」

当机器人流量超过人类、当AI公司之间开始公开撕扯彼此的安全叙事、当最聪明的CEO们承认「我们不知道」的时候,真正的问题不是AI什么时候会失控。

真正的问题是:如果连造AI的人都搞不清楚自己在造什么,我们凭什么相信他们能管好?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

推荐阅读

  • 微软AI CEO说Anthropic被自己造的AI洗了脑,同一天机器人接管了互联网

    6月10日,两条新闻踩在同一天。一条是人咬人,一条是机器人咬掉了互联网的一大块肉。 先说人咬人。 微软AI部门的老大Mustafa Suleyman,在The Verge的Decoder播客上,用了一…

  • Anthropic把Mythos放出来了,OpenAI把招股书交了:同一天,AI最不敢碰的两个禁区一起破了

    6月9日晚上到10日凌晨,AI圈干了两件事。每件单独拿出来都够写一篇长文。放到同一天,就成了一道分水岭。 先说第一件。 被封印了两个月的最强模型,Anthropic突然不藏了 如果你一直在关注Anth…

  • 苹果把Siri押在Google身上,微软阿里却在拼命「去依赖化」:WWDC 2026,只有苹果敢这么玩

    北京时间6月9日凌晨1点,Tim Cook最后一次以CEO身份站上WWDC的舞台。 没有新硬件。没有One More Thing。整场发布会,只讲了一件事——AI。 确切地说,是Siri AI。 15…

  • 美团一天开源7个AI项目,阿里拉瑞幸肯德基入局,豆包开始收费:中国互联网巨头不卷模型了

    上周(6月3日到7日),三家中国互联网巨头各自放了一颗信号弹。 6月3日,阿里宣布千问APP向第三方Agent和Skill全面开放,瑞幸、肯德基、蜜雪冰城、东方航空成为首批接入企业。同一天,豆包发布官…

暗夜独行