两周前,也就是6月1号,GitHub Copilot 悄悄把计费方式从”包月随便用”改成了”按 Token 量实际算钱”。
当时公告发出来的时候,大多数人的反应是:”嗯,知道了。”然后继续写代码。
直到前几天,第一批真实账单开始在 Reddit、X 和 GitHub 讨论区里出现。一位开发者贴出了自己的账单:原本 $39/月,现在飙到了 $750。另一个人说他的三人团队从月均 $50 跳到了 $3000。
这些数字是真的吗?有可能。但不是每个人都会被割这么狠。你的账单涨不涨、涨多少,取决于你怎么用——更准确地说,取决于你知不知道该怎么用。
这篇文章想做的事很简单:用不长的时间,帮你在下一张账单到来之前把账算清楚。
变的是什么,不变的是什么
先别慌。代码补全(Tab 触发的那种行内联想)和 Next Edit Suggestions,仍然是免费的,不限量。GitHub 在这件事上还算体面。
变的是交互式功能——Chat 对话、Agent 模式、PR 摘要和代码审查——这些从”包月无限”变成了”用多少 Token 扣多少钱”。
具体来说,新的计费单位叫 AI Credits:1 Credit = 0.01 美元。每次你让 Copilot Chat 回答一个问题、让 Agent 跑一次重构、让机器人总结一个 PR,后台都会根据你调用的是哪个模型、上下文有多大、输出了多少内容,算出一个 Token 量,然后换算成 Credits 扣掉。
旧的 PRU 模式还有一个”缓冲垫”——额度用完了降级到一个免费的基础模型,至少还能继续用。新模式下,Credit 花完了就花完了,高级功能直接锁住,除非你手动设了预算上限并且启用了”到达上限时停止”的开关——而默认情况下,这个开关是关着的。
各套餐本身的月费没变:Pro $10、Pro+ $39、Business $19/人、Enterprise $39/人。但套餐里包含的 Credits 等于你的月费金额(Pro 含 $10 等值 Credits,Pro+ 含 $39),超过的部分按量从你绑定的支付方式扣款。
如果你觉得这听起来有点像手机流量套餐——没错,就是这个逻辑。而半年前 AI 编程工具还在比谁家模型更强(当时的”三国杀”局面我还写过),现在已经到了谁家用着不心疼的阶段。
选对模型,是省钱的第一个动作
同样的任务,用不同模型跑,价格能差 46 倍。这是 GitHub Copilot Agent HQ 目前支持的几个主要模型,以及每百万 Token 的输入/输出价格(数据基于 GitHub 官方定价及4SAPI社区交叉验证):
| 模型 | 输入(/百万Token) | 输出(/百万Token) | 适合干什么 |
|---|---|---|---|
| Gemini 3.5 Flash | $0.30 | $2.50 | 日常问答、文档查询、简单纠错 |
| GPT-5 mini | $0.25 | $2.00 | 轻量编码辅助、代码解释 |
| Claude Haiku 4.5 | $1.00 | $5.00 | 快速迭代、简单重构 |
| GPT-5.3 Codex | $1.50 | $6.00 | 中等复杂度编程任务 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 综合编码、架构讨论 |
| GPT-5.5 | $3.75 | $15.00 | 复杂推理、跨文件架构 |
| Claude Opus 4.8 | $15.00 | $75.00 | 顶级复杂推理(慎用) |
一个日常场景来感受一下:你在 Copilot Chat 里问五个问题,每次大约 4000 Token 的输入 + 800 Token 的输出。
- 用 Claude Sonnet 4.6:大约 $0.21(22 Credits)
- 用 GPT-5 mini:大约 $0.016(不到 2 Credits)
如果你每天有 20 次这样的对话,一个月 20 个工作日:
- Sonnet:约 $84 的额外账单
- GPT-5 mini:约 $6.40
差距是 13 倍,而你在绝大多数日常问题中,根本分辨不出这两者的回答质量有什么区别。
如果你经常跑 Agent 模式——那种会自己打开文件、改代码、跨多个文件重构的模式——就更要小心了。Agent 默认会把整个工作区索引一遍当上下文,一次会话轻松吃掉 5 万到 10 万 Token。用 GPT-5.5 跑一次:约 $0.94。用 Claude Opus 4.8 跑一次:约 $4.50。
一天跑十次,一个月下来,光 Agent 这一项就能烧掉你一百多甚至几百美元。而这些东西,当初花 $39 包月的时候是完全不算账的。
Agent HQ 的多模型模式:什么时候用谁?
6 月份 GitHub 正式把 Anthropic 的 Claude 和 OpenAI 的 Codex 纳入了 Agent HQ,加上原有的 Copilot,你现在可以在同一个 Issue 或 PR 的不同步骤里切换不同的 AI 代理来处理。在 VS Code、GitHub 网页端和移动端都能操作。
这对省钱来说是一条暗线——因为每个模型擅长的事不一样,价格也天差地别。用对的模型做对的事,不只是效果更好,更是财务上的基本操作。
日常编码辅助 → GPT-5 mini 或 Gemini 3.5 Flash
写个常见的函数、解释一段正则、查一下某个 API 的用法——这些场景下,轻量模型完全够用。不需要出动 GPT-5.5 或 Sonnet 来回答”JavaScript 里 ?? 和 || 有什么区别”。
中等编程任务 → GPT-5.3 Codex 或 Claude Haiku 4.5
Debug 一个中等复杂度的 bug、写单元测试、优化一小段算法——Codex 的编程专项能力在性价比上是目前最好的选择之一。
复杂架构讨论 → Claude Sonnet 4.6 或 GPT-5.5
跨多个模块的重构方案、选型决策、性能瓶颈分析——这种需要”理解整个项目”的任务,才值得上中高端模型。
Opus 4.8 什么时候用?
几乎不用。除非你在做一个极其复杂的算法、需要用到一个你确定其他模型都搞不定的推理能力——而且你在动手之前就知道这一点。把它当成一个”核选项”,而不是默认选项。
在 Agent HQ 里的实际操作很简单:创建任务时从代理列表里选对应的模型就行,任务和任务之间可以无缝切换,上下文不会丢。这是在一个 Issue 里用三个不同模型处理三个步骤的标准姿势。
说到 Claude Code 的近况,两周前的 /fork 命令 和上周的 agent-skills 工程化实践 我都有详细写过,如果你在 Agent HQ 之外也在用 Claude Code,那两篇会有帮助。
六条立刻能用的省钱操作
1. 马上设硬性消费上限
打开 GitHub → Settings → Billing → Spending limits,设一个月度上限,然后一定记得勾选”到达上限时停止使用”。不勾的话,上限只是一个通知,钱照样扣。Pro+ 用户建议先设 $50,跑一个月看看实际消耗再调整。
2. 把默认模型从 Sonnet 换成 Gemini Flash 或 GPT-5 mini
这是影响最大的单一动作。在 Copilot Chat 的设置里找到模型选择,把默认从 Claude Sonnet 4.6(大概率是当前的默认值)切到 Gemini 3.5 Flash 或 GPT-5 mini。遇到真正复杂的问题时再临时切回高端模型。每天的琐碎问答会吃掉你 80% 的 Token 消耗,但这些问题的难度用轻量模型来解决就够了。
3. 缩小 Agent 的搜索范围
Agent 模式默认索引整个工作区,这是最大的一块隐性消耗。在项目根目录创建一个 .github/copilot-instructions.md 文件,明确告诉 Agent 只关注哪些目录、忽略哪些路径(比如 node_modules、dist、.next、build)。实测把上下文从 10 万 Token 压缩到 2 万,输入成本直接砍掉 80%。
4. 把对话打包,不要散着问
每开一次新对话,系统都要重新加载上下文和提示词,这部分的 Token 消耗是固定的”入场费”。五个问题分五次问,成本远高于五个问题一次问完。把相关的问题攒一攒,一次会话集中处理。
5. PR 审查从”自动”改成”手动请求”
Copilot 的代码审查会双重计费——同时消耗 AI Credits 和 GitHub Actions 时长。私有仓库尤其明显。在设置里把 Code Review 的触发方式从”每次 PR 自动触发”改成”手动请求”,只在重要的 PR 上才调用。
6. 第一周就去看用量面板
路径:GitHub Settings → Billing → Usage。它会按模型拆解你的 Token 消耗。跑完一周就去看看,哪些模型在吃你的钱,立刻调整。别等到月底账单出来才后悔。
这些操作我在自己项目里全部验证过。其中第 3 条(缩小 Agent 搜索范围)效果最明显——之前一个 Next.js 项目的 Agent 会话成本从每次 $2-3 降到 $0.3-0.5。如果你的项目结构比较深,比如 monorepo,效果会更显著。
如果实在受不了,替代方案怎么选
一轮一轮算账下来,你会发现一个尴尬的事:Copilot 的新定价对于”轻度用户”几乎没影响,但对于”重度用户”——那些真正把 AI 编程深度融入工作流的人——反而不划算了。
好消息是,2026 年 AI 编程工具的竞争比任何时候都激烈。如果你在考虑换,这里是几个主流选项的实际情况:
Cursor($20/月)
固定月费,内置的 Composer 2.5 使用自研模型,在编程基准测试上的表现接近 Opus 4.8 和 GPT-5.5。对每天跑 Agent 模式的人来说,$20 封顶比 Copilot 的浮动账单踏实得多。
Claude Code($17-$100/月)
Anthropic 的终端原生编程工具,5 月份刚刚把各套餐的用量限额翻了一倍。Pro 套餐 $17/月、Max $100/月,都是固定费用。如果你主要是做深度代码理解和长会话重构(而不是频繁的短问答),Claude Code 的可预测成本比 Copilot 的按量计费有优势。/fork 命令那篇详细聊过 Claude Code 在长会话场景下的使用技巧。
Windsurf($20-$200/月)
Pro 版 $20/月封顶,Max 版 $200/月带 Devin Cloud 和 Terminal CLI。如果你需要的是能自己跑好几个小时的自主 Agent,Max 套餐的一口价比 Copilot 的按量划算。
混合方案:目前最理性的选择
不少开发者在讨论区推荐的组合拳:保留 Copilot Pro($10/月),只用它的免费代码补全和 Next Edit Suggestions——这两个功能在新计费下仍然是无限免费的。然后另外买 Cursor 或 Claude Code($17-$20/月)来处理所有 Chat、Agent 和代码审查。
总共 $27-$30 一个月,两边都不封顶,各取所长。这是目前对”重度 AI 编程用户”来说性价比最高的方案。
如果你想知道 AI 编程工具整体发展到了什么程度,去年我写的 AI 实战应用指南 里的编程章节依然适用——那时候讲的是”怎么选第一把 AI 编程工具”,现在是”怎么在用的过程中不破产”,算是一个续集。
计费方式变了,但工具还是工具
GitHub 做这个决定,从商业上讲并不难理解。一个 $39/月的套餐,背后可能跑的是 $75/百万 Token 输出成本的 Claude Opus 4.8——这样的账平不了。Token 计费是整个 AI 行业的底层逻辑,Copilot 只是不再替你”补贴”重度的 Agent 使用量了。
联想 CEO 在财报会上说过一句话:”AI 不贵,拼命用 AI 才贵。”(那篇分析里详细写过)。放在 Copilot 的新定价上,这句话更贴切了。
真正的问题不在于计费方式本身,而在于大部分人没有意识到自己可以选择用什么模型、没有去设消费上限、没有去调整 Agent 的工作范围。这些操作不复杂,加起来只要十分钟。但如果你不做,账单就会替你”做决定”。
过去两周的社区反馈已经说明了一件事:AI 编程工具从”包月自助餐”变成”按克称重的精品超市”之后,会用和不会用之间的差距,不止体现在代码质量上,还会体现在信用卡账单上。
在你退出这篇文章之前,先打开两样东西:GitHub 的 Copilot 用量面板,和 Billing 页面里的 Spending Limit 开关。十分钟后,你会感谢自己。
本文数据基于 GitHub Copilot 官方 2026 年 6 月计费文档、开发者社区实测反馈(Reddit / X / Dev.to)、4SAPI 费率解析(Copilot 计费指南)及 CSDN AI 日报 6 月 15 日报道(每日AI新闻推送 6月15日),模型定价可能随官方更新调整,建议以 GitHub 最新公告为准。




发表回复