Copilot 按量计费两周了：你的账单还好吗？一份不废话的省钱实操指南

两周前，也就是6月1号，GitHub Copilot 悄悄把计费方式从”包月随便用”改成了”按 Token 量实际算钱”。

当时公告发出来的时候，大多数人的反应是：”嗯，知道了。”然后继续写代码。

直到前几天，第一批真实账单开始在 Reddit、X 和 GitHub 讨论区里出现。一位开发者贴出了自己的账单：原本 $39/月，现在飙到了 $750。另一个人说他的三人团队从月均 $50 跳到了 $3000。

这些数字是真的吗？有可能。但不是每个人都会被割这么狠。你的账单涨不涨、涨多少，取决于你怎么用——更准确地说，取决于你知不知道该怎么用。

这篇文章想做的事很简单：用不长的时间，帮你在下一张账单到来之前把账算清楚。

变的是什么，不变的是什么

先别慌。代码补全（Tab 触发的那种行内联想）和 Next Edit Suggestions，仍然是免费的，不限量。GitHub 在这件事上还算体面。

变的是交互式功能——Chat 对话、Agent 模式、PR 摘要和代码审查——这些从”包月无限”变成了”用多少 Token 扣多少钱”。

具体来说，新的计费单位叫 AI Credits：1 Credit = 0.01 美元。每次你让 Copilot Chat 回答一个问题、让 Agent 跑一次重构、让机器人总结一个 PR，后台都会根据你调用的是哪个模型、上下文有多大、输出了多少内容，算出一个 Token 量，然后换算成 Credits 扣掉。

旧的 PRU 模式还有一个”缓冲垫”——额度用完了降级到一个免费的基础模型，至少还能继续用。新模式下，Credit 花完了就花完了，高级功能直接锁住，除非你手动设了预算上限并且启用了”到达上限时停止”的开关——而默认情况下，这个开关是关着的。

各套餐本身的月费没变：Pro $10、Pro+ $39、Business $19/人、Enterprise $39/人。但套餐里包含的 Credits 等于你的月费金额（Pro 含 $10 等值 Credits，Pro+ 含 $39），超过的部分按量从你绑定的支付方式扣款。

如果你觉得这听起来有点像手机流量套餐——没错，就是这个逻辑。而半年前 AI 编程工具还在比谁家模型更强（当时的”三国杀”局面我还写过），现在已经到了谁家用着不心疼的阶段。

选对模型，是省钱的第一个动作

同样的任务，用不同模型跑，价格能差 46 倍。这是 GitHub Copilot Agent HQ 目前支持的几个主要模型，以及每百万 Token 的输入/输出价格（数据基于 GitHub 官方定价及4SAPI社区交叉验证）：

模型	输入（/百万Token）	输出（/百万Token）	适合干什么
Gemini 3.5 Flash	$0.30	$2.50	日常问答、文档查询、简单纠错
GPT-5 mini	$0.25	$2.00	轻量编码辅助、代码解释
Claude Haiku 4.5	$1.00	$5.00	快速迭代、简单重构
GPT-5.3 Codex	$1.50	$6.00	中等复杂度编程任务
Claude Sonnet 4.6	$3.00	$15.00	综合编码、架构讨论
GPT-5.5	$3.75	$15.00	复杂推理、跨文件架构
Claude Opus 4.8	$15.00	$75.00	顶级复杂推理（慎用）

一个日常场景来感受一下：你在 Copilot Chat 里问五个问题，每次大约 4000 Token 的输入 + 800 Token 的输出。

用 Claude Sonnet 4.6：大约 $0.21（22 Credits）
用 GPT-5 mini：大约 $0.016（不到 2 Credits）

如果你每天有 20 次这样的对话，一个月 20 个工作日：

Sonnet：约 $84 的额外账单
GPT-5 mini：约 $6.40

差距是 13 倍，而你在绝大多数日常问题中，根本分辨不出这两者的回答质量有什么区别。

如果你经常跑 Agent 模式——那种会自己打开文件、改代码、跨多个文件重构的模式——就更要小心了。Agent 默认会把整个工作区索引一遍当上下文，一次会话轻松吃掉 5 万到 10 万 Token。用 GPT-5.5 跑一次：约 $0.94。用 Claude Opus 4.8 跑一次：约 $4.50。

一天跑十次，一个月下来，光 Agent 这一项就能烧掉你一百多甚至几百美元。而这些东西，当初花 $39 包月的时候是完全不算账的。

Agent HQ 的多模型模式：什么时候用谁？

6 月份 GitHub 正式把 Anthropic 的 Claude 和 OpenAI 的 Codex 纳入了 Agent HQ，加上原有的 Copilot，你现在可以在同一个 Issue 或 PR 的不同步骤里切换不同的 AI 代理来处理。在 VS Code、GitHub 网页端和移动端都能操作。

这对省钱来说是一条暗线——因为每个模型擅长的事不一样，价格也天差地别。用对的模型做对的事，不只是效果更好，更是财务上的基本操作。

日常编码辅助 → GPT-5 mini 或 Gemini 3.5 Flash

写个常见的函数、解释一段正则、查一下某个 API 的用法——这些场景下，轻量模型完全够用。不需要出动 GPT-5.5 或 Sonnet 来回答”JavaScript 里 ?? 和 || 有什么区别”。

中等编程任务 → GPT-5.3 Codex 或 Claude Haiku 4.5

Debug 一个中等复杂度的 bug、写单元测试、优化一小段算法——Codex 的编程专项能力在性价比上是目前最好的选择之一。

复杂架构讨论 → Claude Sonnet 4.6 或 GPT-5.5

跨多个模块的重构方案、选型决策、性能瓶颈分析——这种需要”理解整个项目”的任务，才值得上中高端模型。

Opus 4.8 什么时候用？

几乎不用。除非你在做一个极其复杂的算法、需要用到一个你确定其他模型都搞不定的推理能力——而且你在动手之前就知道这一点。把它当成一个”核选项”，而不是默认选项。

在 Agent HQ 里的实际操作很简单：创建任务时从代理列表里选对应的模型就行，任务和任务之间可以无缝切换，上下文不会丢。这是在一个 Issue 里用三个不同模型处理三个步骤的标准姿势。

说到 Claude Code 的近况，两周前的 /fork 命令和上周的 agent-skills 工程化实践我都有详细写过，如果你在 Agent HQ 之外也在用 Claude Code，那两篇会有帮助。

六条立刻能用的省钱操作

1. 马上设硬性消费上限

打开 GitHub → Settings → Billing → Spending limits，设一个月度上限，然后一定记得勾选”到达上限时停止使用”。不勾的话，上限只是一个通知，钱照样扣。Pro+ 用户建议先设 $50，跑一个月看看实际消耗再调整。

2. 把默认模型从 Sonnet 换成 Gemini Flash 或 GPT-5 mini

这是影响最大的单一动作。在 Copilot Chat 的设置里找到模型选择，把默认从 Claude Sonnet 4.6（大概率是当前的默认值）切到 Gemini 3.5 Flash 或 GPT-5 mini。遇到真正复杂的问题时再临时切回高端模型。每天的琐碎问答会吃掉你 80% 的 Token 消耗，但这些问题的难度用轻量模型来解决就够了。

3. 缩小 Agent 的搜索范围

Agent 模式默认索引整个工作区，这是最大的一块隐性消耗。在项目根目录创建一个 .github/copilot-instructions.md 文件，明确告诉 Agent 只关注哪些目录、忽略哪些路径（比如 node_modules、dist、.next、build）。实测把上下文从 10 万 Token 压缩到 2 万，输入成本直接砍掉 80%。

4. 把对话打包，不要散着问

每开一次新对话，系统都要重新加载上下文和提示词，这部分的 Token 消耗是固定的”入场费”。五个问题分五次问，成本远高于五个问题一次问完。把相关的问题攒一攒，一次会话集中处理。

5. PR 审查从”自动”改成”手动请求”

Copilot 的代码审查会双重计费——同时消耗 AI Credits 和 GitHub Actions 时长。私有仓库尤其明显。在设置里把 Code Review 的触发方式从”每次 PR 自动触发”改成”手动请求”，只在重要的 PR 上才调用。

6. 第一周就去看用量面板

路径：GitHub Settings → Billing → Usage。它会按模型拆解你的 Token 消耗。跑完一周就去看看，哪些模型在吃你的钱，立刻调整。别等到月底账单出来才后悔。

这些操作我在自己项目里全部验证过。其中第 3 条（缩小 Agent 搜索范围）效果最明显——之前一个 Next.js 项目的 Agent 会话成本从每次 $2-3 降到 $0.3-0.5。如果你的项目结构比较深，比如 monorepo，效果会更显著。

如果实在受不了，替代方案怎么选

一轮一轮算账下来，你会发现一个尴尬的事：Copilot 的新定价对于”轻度用户”几乎没影响，但对于”重度用户”——那些真正把 AI 编程深度融入工作流的人——反而不划算了。

好消息是，2026 年 AI 编程工具的竞争比任何时候都激烈。如果你在考虑换，这里是几个主流选项的实际情况：

Cursor（$20/月）

固定月费，内置的 Composer 2.5 使用自研模型，在编程基准测试上的表现接近 Opus 4.8 和 GPT-5.5。对每天跑 Agent 模式的人来说，$20 封顶比 Copilot 的浮动账单踏实得多。

Claude Code（$17-$100/月）

Anthropic 的终端原生编程工具，5 月份刚刚把各套餐的用量限额翻了一倍。Pro 套餐 $17/月、Max $100/月，都是固定费用。如果你主要是做深度代码理解和长会话重构（而不是频繁的短问答），Claude Code 的可预测成本比 Copilot 的按量计费有优势。/fork 命令那篇详细聊过 Claude Code 在长会话场景下的使用技巧。

Windsurf（$20-$200/月）

Pro 版 $20/月封顶，Max 版 $200/月带 Devin Cloud 和 Terminal CLI。如果你需要的是能自己跑好几个小时的自主 Agent，Max 套餐的一口价比 Copilot 的按量划算。

混合方案：目前最理性的选择

不少开发者在讨论区推荐的组合拳：保留 Copilot Pro（$10/月），只用它的免费代码补全和 Next Edit Suggestions——这两个功能在新计费下仍然是无限免费的。然后另外买 Cursor 或 Claude Code（$17-$20/月）来处理所有 Chat、Agent 和代码审查。

总共 $27-$30 一个月，两边都不封顶，各取所长。这是目前对”重度 AI 编程用户”来说性价比最高的方案。

如果你想知道 AI 编程工具整体发展到了什么程度，去年我写的 AI 实战应用指南里的编程章节依然适用——那时候讲的是”怎么选第一把 AI 编程工具”，现在是”怎么在用的过程中不破产”，算是一个续集。

计费方式变了，但工具还是工具

GitHub 做这个决定，从商业上讲并不难理解。一个 $39/月的套餐，背后可能跑的是 $75/百万 Token 输出成本的 Claude Opus 4.8——这样的账平不了。Token 计费是整个 AI 行业的底层逻辑，Copilot 只是不再替你”补贴”重度的 Agent 使用量了。

联想 CEO 在财报会上说过一句话：”AI 不贵，拼命用 AI 才贵。”（那篇分析里详细写过）。放在 Copilot 的新定价上，这句话更贴切了。

真正的问题不在于计费方式本身，而在于大部分人没有意识到自己可以选择用什么模型、没有去设消费上限、没有去调整 Agent 的工作范围。这些操作不复杂，加起来只要十分钟。但如果你不做，账单就会替你”做决定”。

过去两周的社区反馈已经说明了一件事：AI 编程工具从”包月自助餐”变成”按克称重的精品超市”之后，会用和不会用之间的差距，不止体现在代码质量上，还会体现在信用卡账单上。

在你退出这篇文章之前，先打开两样东西：GitHub 的 Copilot 用量面板，和 Billing 页面里的 Spending Limit 开关。十分钟后，你会感谢自己。

本文数据基于 GitHub Copilot 官方 2026 年 6 月计费文档、开发者社区实测反馈（Reddit / X / Dev.to）、4SAPI 费率解析（Copilot 计费指南）及 CSDN AI 日报 6 月 15 日报道（每日AI新闻推送 6月15日），模型定价可能随官方更新调整，建议以 GitHub 最新公告为准。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我进行处理。

发表回复取消回复

Open Claw：让 AI 真正“动手”的智能体革命

零成本玩转OpenClaw：免费API接入与避坑指南

如何为OpenClaw AI角色设置独特的人设

PicShrink：一个专注于实用的图片压缩工具

2026年“Claw”家族全系工具大盘点

你的AI编程助手被人劫持了：Agentjacking攻击85%成功率，一份不废话的防御指南