Claude Sonnet 5 来了,免费用户直接用:百万上下文、编程能力暴涨,Anthropic 把看家本领塞进了中杯

6 月 30 号晚上,Anthropic 悄悄上线了 Claude Sonnet 5。

没开发布会,没预热,连个倒计时页面都没有。就这么直接把新模型设成了 Free 和 Pro 用户的默认选项,顺手把 Sonnet 4.6 送进了历史。

如果你今天打开 Claude 网页版或者 App,看到的已经是 Sonnet 5 了。不用申请、不用加钱、不用切模型——它已经替你选好了。

那这个”不声不响”上线的新模型,到底值不值得你认真用?我先甩三个数字:

  • 上下文窗口从 20 万字直接拉到 100 万 token,是前代的 5 倍,也是 Sonnet 系列第一次突破百万
  • 编程基准 SWE-bench 冲到 63.2%,Sonnet 4.6 是 58.1%,Opus 4.8 是 69.2%——差了不到 6 个百分点,价格却省了 60%
  • API 价格 $2/$10 每百万 token(输入/输出),促销到 8 月 31 号,之后涨到 $3/$15——但即使按标准价算,也跟 Sonnet 4.6 一个价

换句话说:用中杯的钱,喝到了接近超大杯的料。

Sonnet 5 到底强在哪

说句实话,Sonnet 4.6 并没有特别能打。尤其是智能体任务——让它连续干几件事,到第三四步就容易掉链子。Sonnet 5 解决的,恰好是这个痛点。

Anthropic 官方给了三个核心升级方向:

1. 智能体能力:终于能一口气把活干完了

用几个早期用户的反馈来感受一下。

Zapier 的工程师给了 Sonnet 5 一个两步任务:先更新 Salesforce 的客户分级,再自动发一封上线通知邮件。Sonnet 4.6 做到一半就停了——该改的数据改了,邮件忘了发。Sonnet 5 一口气跑完,收工。

Cursor 的联合创始人 Sualeh Asif 说得更直白:”Agent 能老老实实待在计划里,按我们的规范写出干净的多步骤改动,成本还控制得住。”

还有个 Rust 工程师的案例:他让 Sonnet 5 查一个 bug。模型不光找到了问题,还自己写了个复现测试、修了代码、然后把修改 stash 掉验证 bug 确实回来了——全程没被提示,自己就做了。这种”不请自来”的质量检查,以前只在 Opus 身上见过。

这说明什么?Sonnet 5 不再是一个”你说一句它做一句”的工具,它开始有了一点主动性。这种主动性在编程和自动化场景里,价值巨大。

2. 百万上下文:一本《三体》三册全扔进去

Sonnet 5 的上下文窗口是 100 万 token,Sonnet 4.6 是 20 万。涨了 5 倍。

这是什么概念?《三体》三部曲加起来大约 90 万字,折合中文 token 大概 120 万左右——略超 100 万,但差得不多了。一本 500 页的技术书,大概 30-40 万 token,Sonnet 5 能一口气吃掉两本半。

以前用 Sonnet 4.6 读长文档,经常读到后面忘了前面——不是因为模型笨,是被上下文窗口卡住了。现在你把整个项目的 README + 核心模块的源码 + API 文档全扔进去,它都能一次性理解。

对于需要做代码审查、长文档分析、法律合同审阅的人来说,这个升级是实打实的生产力提升。你不再需要把文档切碎了分次喂,也不用担心它读到第三段就忘了第一段说的是什么。

3. 编程能力:离 Opus 只差临门一脚

SWE-bench 63.2% vs Opus 4.8 的 69.2%——差 6 个百分点。但在知识工作基准上,Sonnet 5 甚至略微超过了 Opus 4.8

早期用户 Dominic Elm 的评价很有参考价值:”Sonnet 5 最强的是处理遗留代码——竞态条件、隐藏的测试用例、没人愿意碰的那部分。它能追踪到问题的根因,给出一个能用的修复,而不是打个补丁敷衍了事。”

这说明它不只是在”能写代码”这个维度上进步了,更关键的是在”能理解和修复复杂代码”这个维度上拉近了和 Opus 的距离。

跟旧款怎么选

直接给结论:

你的情况用哪个理由
Free / Pro 用户Sonnet 5(已默认)白送的升级,没理由不用
开发者,日常编程 + 自动化Sonnet 5能力逼近 Opus,成本只有 40%,8 月 31 号前更便宜
重度 Claude Code 用户Sonnet 51M 上下文 + 更强的智能体能力,体验明显提升
需要极致推理精度Opus 4.8SWE-bench 69.2%,复杂推理链条上还是强一截
还在用 Sonnet 4.6立刻升Sonnet 5 在所有基准上碾压 4.6,价格一样,没理由留

一个比较容易忽略的点:Anthropic 为 Sonnet 5 引入了”自适应思考”(adaptive thinking),默认开启。你不用像以前那样手动设置 `thinking` 参数,模型自己会判断什么时候该多想一步、什么时候可以直接给答案。对于不熟悉 API 参数配置的用户来说,这个改进省了不少事。

三种使用方式

方式一:网页版 / App(零门槛)

打开 claude.ai 或者 Claude App,登录你的账号。如果你用的是 Free 或 Pro 计划,Sonnet 5 已经是默认模型了,什么都不用做。

Pro 用户($20/月)能获得更高的用量配额,Max 用户($100/月)和 Team/Enterprise 用户有更多额度。另外 Fable 5 也恢复了全球访问,Pro 及以上用户每周可以用 50% 的额度体验。

方式二:Claude Code(开发者首选)

如果你在用 Claude Code,切到 Sonnet 5 只要改一行配置。在 Claude Code 的设置里把模型选为 `claude-sonnet-5` 就行。

搭配 1M 的上下文窗口,你现在可以把整个项目的代码仓库一次性加载进去让 Claude Code 分析。之前被上下文限制卡住的工作流——比如跨模块重构、全项目代码审查、批量测试生成——现在可以跑得更顺畅。

方式三:API(灵活集成)

如果你是通过 API 调用(比如用 AI 编程工具 做工程化集成),把模型 ID 从 `claude-sonnet-4-6` 改成 `claude-sonnet-5` 就行。

Bash
model = "claude-sonnet-5"  # 改这一行

定价方面,推介期到 8 月 31 号:$2/百万输入 token,$10/百万输出 token。之后涨到 $3/$15——仍然跟 Sonnet 4.6 一个价。对比 Opus 4.8 的 $5/$25,便宜了 60%。

Anthropic 还提高了各平台的速率限制,来适配高 effort 级别下更大的 token 消耗。用户可以在 API 调用时通过 effort 参数(low/medium/high/xhigh)控制模型的”思考深度”——简单的任务用低 effort 省钱,复杂任务拉高 effort 换质量。

国内用户怎么用

说实话,国内直接用 Anthropic 的服务不太方便。claude.ai 网页版和 API 都无法直连,需要自己解决网络问题。

如果你不想折腾,有几个替代思路:

  • 国产平替DeepSeek、豆包、通义千问 在中文场景下的编程和写作能力已经相当能打,而且原生支持国内直连。如果你主要用中文做开发,完全不比 Sonnet 差。
  • 通过云平台中转:Anthropic 在 AWS Bedrock、Google Cloud Vertex AI、Microsoft Azure Foundry 上都提供了 Sonnet 5。如果你公司已经在用这些云服务,可以绕开直连限制。
  • 本地部署:如果你的场景是内部文档处理、代码审查等不需要联网的活,本地部署开源大模型 也是一个可行的选项。虽然单模型能力比不上 Sonnet 5,但胜在私密、免费、不依赖外部网络。

几个需要知道的坑

说完成绩单,讲几个实际使用中容易踩的坑。

Token 计费变了

Sonnet 5 换了一个新的 tokenizer,同样的输入,产生的 token 数比 Sonnet 4.6 多出大约 30%。举个例子:以前 1000 个 token 能覆盖的一段文本,现在可能需要 1300 个 token。

Anthropic 说推介定价已经把这个因素算进去了,迁移过来大致”费用中性”。但如果你是跑大批量 API 调用的,建议先用自己的实际负载跑一遍对比,不要默认账单不变。尤其在 8 月 31 号之后价格恢复正常,30% 的 token 膨胀会更直接地体现在账单上。

另一个连锁影响:`max_tokens` 参数需要重新评估。因为同样的输出内容现在消耗更多 token,之前在 Sonnet 4.6 上调好的 `max_tokens` 值可能导致输出被截断。

不再接受采样参数

如果你在 API 调用里手动设置了 `temperature`、`top_p` 或 `top_k`,Sonnet 5 会直接返回 400 错误。这三个参数在 Opus 4.7 上就已经被禁了,现在 Sonnet 系列也跟进了。

迁移的时候记得把这些参数删掉,用 System Prompt 来引导模型行为。对大多数用户来说这个改动影响不大——默认值本来就够用。

思维链模式变了

Sonnet 5 默认开启了”自适应思考”(adaptive thinking),模型会自动判断一个任务需要多想几步还是可以直接回答。你不传 `thinking` 参数的话就是这个模式。

如果你想关掉思考以节省 token,需要显式传 `thinking: {type: “disabled”}`。如果你之前在用 `thinking: {type: “enabled”, budget_tokens: 32000}` 这种手动模式,切到 Sonnet 5 之后这行代码会报错——请改用 `thinking: {type: “adaptive”}` 配合 effort 参数来控制。

AI 编程的成本账

每次有更强大的新模型出来,大家容易忽略一件事:能力强了,用的 token 也会变多。尤其是带自适应思考 + 高 effort 级别的场景,一次复杂编程任务的 token 消耗可能远超你的预期。

如果你在大量使用 AI 编程助手,建议关注一下 token 消耗。工具本身的能力提升 + 更复杂的任务 = 账单可能比你想的要高。好消息是 Sonnet 5 的性价比确实比之前的 Sonnet 和 Opus 都好,但”更好”不等于”免费”。

一句话总结

Anthropic 这次更新,本质上做了一件事:把 Opus 级别的智能体能力,打到了中杯的价格带上。

对普通用户来说,这是一次免费的能力升级,今天打开 Claude 就能用。对开发者来说,这是一个信号:AI 编程的成本曲线还在往下走,好的工具正在变得更便宜。对之前犹豫要不要从 Opus 降级到 Sonnet 的人来说,现在不用纠结了——Sonnet 5 基本能满足你 80% 的需求,剩下的 20% 才是 Opus 的战场。

最后说一组数据,帮你记住 Sonnet 5:

  • 100 万 token 上下文(5x Sonnet 4.6)
  • SWE-bench 63.2%(Opus 是 69.2%,差不到 6 个点)
  • 价格比 Opus 便宜 60%
  • 免费用户就能用,Pro 用户不限额度用完为止

如果你今天还没试过,打开 claude.ai,登录就能用。不需要等,它已经在等你了。


更多 AI 实用指南,可以看看之前的 AI 实战应用指南(2026 版):普通人也能用好的 10 个场景

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

推荐阅读

  • Claude Sonnet 5 来了,免费用户直接用:百万上下文、编程能力暴涨,Anthropic 把看家本领塞进了中杯

    6 月 30 号晚上,Anthropic 悄悄上线了 Claude Sonnet 5。 没开发布会,没预热,连个倒计时页面都没有。就这么直接把新模型设成了 Free 和 Pro 用户的默认选项,顺手把…

  • 合上笔记本,代码照样跑:手机指挥AI编程的三种姿势

    6月30日,Cursor 正式上线了 iOS 移动应用 Cursor Mobile。这不是一个在手机上敲代码的编辑器——它更像遥控器,让你在地铁上、候机室里、甚至洗澡间隙,都能给跑在云端的编程 Age…

  • 不用学剪辑软件了,让 Claude Code 帮你剪视频:browser-use 开源 video-use 上手指南

    适用对象:想剪视频但不想碰 Premiere / Final Cut 的人;已经在用 Claude Code、Codex 或 OpenClaw 的 AI 编程用户。 阅读时间:约 8 分钟。 一、这不…

  • AI 编程助手总把页面改丑?Google Labs 这份 DESIGN.md 让 AI 一次看懂你的设计系统

    让 Claude Code 帮你改一个按钮,它能把圆角、字号、阴影全给你换一遍;让 Cursor 补一个弹窗,它写出来的颜色跟你项目里已有的调色盘八竿子打不着。不是模型不行,是你没把「设计系统」告诉它…

暗夜独行