Claude Sonnet 5 来了，免费用户直接用：百万上下文、编程能力暴涨，Anthropic 把看家本领塞进了中杯

6 月 30 号晚上，Anthropic 悄悄上线了 Claude Sonnet 5。

没开发布会，没预热，连个倒计时页面都没有。就这么直接把新模型设成了 Free 和 Pro 用户的默认选项，顺手把 Sonnet 4.6 送进了历史。

如果你今天打开 Claude 网页版或者 App，看到的已经是 Sonnet 5 了。不用申请、不用加钱、不用切模型——它已经替你选好了。

那这个”不声不响”上线的新模型，到底值不值得你认真用？我先甩三个数字：

上下文窗口从 20 万字直接拉到 100 万 token，是前代的 5 倍，也是 Sonnet 系列第一次突破百万
编程基准 SWE-bench 冲到 63.2%，Sonnet 4.6 是 58.1%，Opus 4.8 是 69.2%——差了不到 6 个百分点，价格却省了 60%
API 价格 $2/$10 每百万 token（输入/输出），促销到 8 月 31 号，之后涨到 $3/$15——但即使按标准价算，也跟 Sonnet 4.6 一个价

换句话说：用中杯的钱，喝到了接近超大杯的料。

Sonnet 5 到底强在哪

说句实话，Sonnet 4.6 并没有特别能打。尤其是智能体任务——让它连续干几件事，到第三四步就容易掉链子。Sonnet 5 解决的，恰好是这个痛点。

Anthropic 官方给了三个核心升级方向：

1. 智能体能力：终于能一口气把活干完了

用几个早期用户的反馈来感受一下。

Zapier 的工程师给了 Sonnet 5 一个两步任务：先更新 Salesforce 的客户分级，再自动发一封上线通知邮件。Sonnet 4.6 做到一半就停了——该改的数据改了，邮件忘了发。Sonnet 5 一口气跑完，收工。

Cursor 的联合创始人 Sualeh Asif 说得更直白：”Agent 能老老实实待在计划里，按我们的规范写出干净的多步骤改动，成本还控制得住。”

还有个 Rust 工程师的案例：他让 Sonnet 5 查一个 bug。模型不光找到了问题，还自己写了个复现测试、修了代码、然后把修改 stash 掉验证 bug 确实回来了——全程没被提示，自己就做了。这种”不请自来”的质量检查，以前只在 Opus 身上见过。

这说明什么？Sonnet 5 不再是一个”你说一句它做一句”的工具，它开始有了一点主动性。这种主动性在编程和自动化场景里，价值巨大。

2. 百万上下文：一本《三体》三册全扔进去

Sonnet 5 的上下文窗口是 100 万 token，Sonnet 4.6 是 20 万。涨了 5 倍。

这是什么概念？《三体》三部曲加起来大约 90 万字，折合中文 token 大概 120 万左右——略超 100 万，但差得不多了。一本 500 页的技术书，大概 30-40 万 token，Sonnet 5 能一口气吃掉两本半。

以前用 Sonnet 4.6 读长文档，经常读到后面忘了前面——不是因为模型笨，是被上下文窗口卡住了。现在你把整个项目的 README + 核心模块的源码 + API 文档全扔进去，它都能一次性理解。

对于需要做代码审查、长文档分析、法律合同审阅的人来说，这个升级是实打实的生产力提升。你不再需要把文档切碎了分次喂，也不用担心它读到第三段就忘了第一段说的是什么。

3. 编程能力：离 Opus 只差临门一脚

SWE-bench 63.2% vs Opus 4.8 的 69.2%——差 6 个百分点。但在知识工作基准上，Sonnet 5 甚至略微超过了 Opus 4.8。

早期用户 Dominic Elm 的评价很有参考价值：”Sonnet 5 最强的是处理遗留代码——竞态条件、隐藏的测试用例、没人愿意碰的那部分。它能追踪到问题的根因，给出一个能用的修复，而不是打个补丁敷衍了事。”

这说明它不只是在”能写代码”这个维度上进步了，更关键的是在”能理解和修复复杂代码”这个维度上拉近了和 Opus 的距离。

跟旧款怎么选

直接给结论：

你的情况	用哪个	理由
Free / Pro 用户	Sonnet 5（已默认）	白送的升级，没理由不用
开发者，日常编程 + 自动化	Sonnet 5	能力逼近 Opus，成本只有 40%，8 月 31 号前更便宜
重度 Claude Code 用户	Sonnet 5	1M 上下文 + 更强的智能体能力，体验明显提升
需要极致推理精度	Opus 4.8	SWE-bench 69.2%，复杂推理链条上还是强一截
还在用 Sonnet 4.6	立刻升	Sonnet 5 在所有基准上碾压 4.6，价格一样，没理由留

一个比较容易忽略的点：Anthropic 为 Sonnet 5 引入了”自适应思考”（adaptive thinking），默认开启。你不用像以前那样手动设置 `thinking` 参数，模型自己会判断什么时候该多想一步、什么时候可以直接给答案。对于不熟悉 API 参数配置的用户来说，这个改进省了不少事。

三种使用方式

方式一：网页版 / App（零门槛）

打开 claude.ai 或者 Claude App，登录你的账号。如果你用的是 Free 或 Pro 计划，Sonnet 5 已经是默认模型了，什么都不用做。

Pro 用户（$20/月）能获得更高的用量配额，Max 用户（$100/月）和 Team/Enterprise 用户有更多额度。另外 Fable 5 也恢复了全球访问，Pro 及以上用户每周可以用 50% 的额度体验。

方式二：Claude Code（开发者首选）

如果你在用 Claude Code，切到 Sonnet 5 只要改一行配置。在 Claude Code 的设置里把模型选为 `claude-sonnet-5` 就行。

搭配 1M 的上下文窗口，你现在可以把整个项目的代码仓库一次性加载进去让 Claude Code 分析。之前被上下文限制卡住的工作流——比如跨模块重构、全项目代码审查、批量测试生成——现在可以跑得更顺畅。

方式三：API（灵活集成）

如果你是通过 API 调用（比如用 AI 编程工具做工程化集成），把模型 ID 从 `claude-sonnet-4-6` 改成 `claude-sonnet-5` 就行。

Bash

model = "claude-sonnet-5"  # 改这一行

model = "claude-sonnet-5"  # 改这一行

定价方面，推介期到 8 月 31 号：$2/百万输入 token，$10/百万输出 token。之后涨到 $3/$15——仍然跟 Sonnet 4.6 一个价。对比 Opus 4.8 的 $5/$25，便宜了 60%。

Anthropic 还提高了各平台的速率限制，来适配高 effort 级别下更大的 token 消耗。用户可以在 API 调用时通过 effort 参数（low/medium/high/xhigh）控制模型的”思考深度”——简单的任务用低 effort 省钱，复杂任务拉高 effort 换质量。

国内用户怎么用

说实话，国内直接用 Anthropic 的服务不太方便。claude.ai 网页版和 API 都无法直连，需要自己解决网络问题。

如果你不想折腾，有几个替代思路：

国产平替：DeepSeek、豆包、通义千问在中文场景下的编程和写作能力已经相当能打，而且原生支持国内直连。如果你主要用中文做开发，完全不比 Sonnet 差。
通过云平台中转：Anthropic 在 AWS Bedrock、Google Cloud Vertex AI、Microsoft Azure Foundry 上都提供了 Sonnet 5。如果你公司已经在用这些云服务，可以绕开直连限制。
本地部署：如果你的场景是内部文档处理、代码审查等不需要联网的活，本地部署开源大模型也是一个可行的选项。虽然单模型能力比不上 Sonnet 5，但胜在私密、免费、不依赖外部网络。

几个需要知道的坑

说完成绩单，讲几个实际使用中容易踩的坑。

Token 计费变了

Sonnet 5 换了一个新的 tokenizer，同样的输入，产生的 token 数比 Sonnet 4.6 多出大约 30%。举个例子：以前 1000 个 token 能覆盖的一段文本，现在可能需要 1300 个 token。

Anthropic 说推介定价已经把这个因素算进去了，迁移过来大致”费用中性”。但如果你是跑大批量 API 调用的，建议先用自己的实际负载跑一遍对比，不要默认账单不变。尤其在 8 月 31 号之后价格恢复正常，30% 的 token 膨胀会更直接地体现在账单上。

另一个连锁影响：`max_tokens` 参数需要重新评估。因为同样的输出内容现在消耗更多 token，之前在 Sonnet 4.6 上调好的 `max_tokens` 值可能导致输出被截断。

不再接受采样参数

如果你在 API 调用里手动设置了 `temperature`、`top_p` 或 `top_k`，Sonnet 5 会直接返回 400 错误。这三个参数在 Opus 4.7 上就已经被禁了，现在 Sonnet 系列也跟进了。

迁移的时候记得把这些参数删掉，用 System Prompt 来引导模型行为。对大多数用户来说这个改动影响不大——默认值本来就够用。

思维链模式变了

Sonnet 5 默认开启了”自适应思考”（adaptive thinking），模型会自动判断一个任务需要多想几步还是可以直接回答。你不传 `thinking` 参数的话就是这个模式。

如果你想关掉思考以节省 token，需要显式传 `thinking: {type: “disabled”}`。如果你之前在用 `thinking: {type: “enabled”, budget_tokens: 32000}` 这种手动模式，切到 Sonnet 5 之后这行代码会报错——请改用 `thinking: {type: “adaptive”}` 配合 effort 参数来控制。

AI 编程的成本账

每次有更强大的新模型出来，大家容易忽略一件事：能力强了，用的 token 也会变多。尤其是带自适应思考 + 高 effort 级别的场景，一次复杂编程任务的 token 消耗可能远超你的预期。

如果你在大量使用 AI 编程助手，建议关注一下 token 消耗。工具本身的能力提升 + 更复杂的任务 = 账单可能比你想的要高。好消息是 Sonnet 5 的性价比确实比之前的 Sonnet 和 Opus 都好，但”更好”不等于”免费”。

一句话总结

Anthropic 这次更新，本质上做了一件事：把 Opus 级别的智能体能力，打到了中杯的价格带上。

对普通用户来说，这是一次免费的能力升级，今天打开 Claude 就能用。对开发者来说，这是一个信号：AI 编程的成本曲线还在往下走，好的工具正在变得更便宜。对之前犹豫要不要从 Opus 降级到 Sonnet 的人来说，现在不用纠结了——Sonnet 5 基本能满足你 80% 的需求，剩下的 20% 才是 Opus 的战场。

最后说一组数据，帮你记住 Sonnet 5：

100 万 token 上下文（5x Sonnet 4.6）
SWE-bench 63.2%（Opus 是 69.2%，差不到 6 个点）
价格比 Opus 便宜 60%
免费用户就能用，Pro 用户不限额度用完为止

如果你今天还没试过，打开 claude.ai，登录就能用。不需要等，它已经在等你了。

更多 AI 实用指南，可以看看之前的 AI 实战应用指南（2026 版）：普通人也能用好的 10 个场景。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我进行处理。

发表回复取消回复

Open Claw：让 AI 真正“动手”的智能体革命

零成本玩转OpenClaw：免费API接入与避坑指南

如何为OpenClaw AI角色设置独特的人设

PicShrink：一个专注于实用的图片压缩工具

2026年“Claw”家族全系工具大盘点