AI 编程成本怎么管?Budi 给了一个 local-first 的工程答案
你有没有发现一个很尴尬的现象:团队开始认真用 AI 写代码以后,最先失控的往往不是代码质量,而是账单。Claude Code、Cursor、Codex CLI、Copilot Chat 各跑各的,每个人都觉得自己只是“顺手问了一下”,月底看费用才发现它已经变成了一项真实的研发成本。更麻烦的是,你很难回答几个最朴素的问题:钱花在哪个 repo?哪个分支?哪个 ticket?哪类任务最烧 token?一次看起来普通的重构,为什么会突然吃掉几十美元? HN 上这两天出现了一个小项目 Budi,标题很直白:local-first AI coding cost tracker。它的 GitHub README 说得更具体:Budi 用来追踪 Claude Code、Cursor、Codex CLI、Copilot CLI 和 Copilot Chat 的 token 与成本,并按 repo、branch、ticket、file 做归因,默认数据都留在本机;可选的云同步只上传聚合后的日报指标,不上传 prompt、代码和回复。项目还很年轻,GitHub stars 只有十几个,但最近提交就在 2026 年 5 月,README、Homebrew tap、Cursor/VS Code 扩展和文档都已经成体系。所以我不会把它包装成“成熟企业级平台”,但它抓住了一个真实问题:AI 编程正在从个人效率工具,变成需要治理的工程基础设施。 这件事比“又一个成本看板”重要。 过去我们管云成本,有 FinOps;管服务质量,有 APM;管模型调用,有 LLM gateway 和 tracing。可 AI coding agent 的调用链很奇怪:它发生在开发者本地,混在编辑器、CLI、终端和 IDE 插件里,很多时候并不经过公司统一网关。你当然可以强推所有请求走代理,但这会碰到权限、延迟、离线开发、个人账号和隐私边界等一堆问题。Budi 的路线反过来:不拦在网络路径上,而是读本地已经存在的 transcript / JSONL / SQLite / session-state,再从这些记录里还原 token、模型、时间、项目上下文和成本。 用人话说,它不是收费站,更像电表。 Budi 官网把这个卖点写得很清楚:安装后本机跑一个小 daemon,tail AI 工具已经写到磁盘的 transcript;编辑器里显示状态栏;CLI 用来做 repo、branch、ticket 级别的归因;“Nothing in your network path”。这句话其实是架构取舍的核心。走网络代理的好处是数据完整、控制力强,可以做限流、审计、脱敏和统一 key 管理;坏处是部署重、侵入强,还可能成为单点故障。走本地日志解析的好处是轻、隐私边界清晰、不中断开发者原有工作流;坏处也明显:不同工具日志格式会变,成本估算依赖 pricing manifest,某些 provider 的真实账单可能需要后续 API reconciliation。 ...