2025年9月10日 星期三

你愛手排車 vs 自排車 - 談 Token 消耗管理,如何平衡 Claude Code 的 MCP & Rule 數量


 

前陣子收集了許多大神的 Claude.md 就一股腦的放進去(好啦還是有整理一下),又時不時地看到什麼很厲害的 MCP 又出了,趕快來裝一下,就讓我們產生了一種幻覺「多串 MCP 工具、多放 claude.md,可以讓開發更方便」,但實際使用下來,你會發現 token 消耗與效能延遲才是真正的瓶頸。這就像開車:

自排車(自動):方便,踩油門就能跑,但油耗通常比較高。
手排車(手動):需要更細膩的操作,雖然麻煩一點,但能更精準控制油耗與性能。

用的越兇,越有這種感覺,使用 Claude Code 串接 MCP & Rule,就是在這兩者之間做取捨。


以 Token 消耗的「油耗」比喻

1. 工具描述自動注入(空轉油耗

就像一台自排車掛在 D 檔,雖然沒動,但油門踩下去一樣耗油。每次載入 MCP 工具描述時,初始就會消耗 1~2 萬 tokens 。

2. 腫大 CLAUDE.md(加強安全,過重載貨)

覺得多加一點 rule 就能讓 LLM 乖乖地的開發,但是一不小心就放太多 context,就像塞滿後車廂和裝了又重又厚的防撞鋼板,每次加速都更吃力。此外一個大專案可能每輪對話就耗掉 3~5 萬 tokens 。


3. 反應延遲(起步頓挫)

太多 context 預載,會拖慢首字回應(2~8 秒不等),像手排沒控制好半離合的卡頓感 ,就算切了 subagent 號稱可以省 context ,需要時才 load 進來執行,但是實際上沒有像大家說的那麼順暢



Best Practices - 像開手排一樣切換?


1. MCP 數量控制 = 擋位切換

少即是多:就像低速擋能上坡,但不可能一路 1 擋跑高速。MCP 工具不是越多越好,而是根據專案需求來選擇。

模組化啟用:建議拆成不同 MCP 套件,只有在需要時才掛上去,而不是一次全開。

模組化專案:這時候 mono repo 感覺就不太好用,簡單的邏輯和固定的功能,最好都能模組化,改用 lib 的方式 include 近來,分開開發。不過這到底算不算是因噎廢食呢?

2. CLAUDE.md 設計 = 輕量車體

切分模組:避免一份 claude.md 塞爆所有內容,可以依專案或功能拆分。

語法隔離:使用分隔語法,降低 context 污染,就像隔離不同檔位的動力輸出 。

3. 成本監控 = 油錶習慣

/cost 指令:養成隨時看 token 用量的習慣,就像開車隨時瞄油錶 ,不過這是使用 API 得習慣,用 Claude code Pro 就是莫名燒光被降級….只能在 model 間切換。

月度試算:以API 搭配其他 IDE 介面來說中度團隊一天 10 輪互動,月成本大約 $15~25 美金;重度專案可達 $50~80 美金,要重新開始抓感覺,建議可以安裝 https://github.com/chiphuyen/sniffly 來分析一下你的花費都在哪些動作。

4. 批次操作 = 長途定速

批次提問:避免零碎多輪的消耗,把需求打包成批次,減少對話增加文件交流,像定速巡航一樣省力。

上下文壓縮:將歷史記憶整理摘要,避免每次都重複載入。

實際建議流程


1. 初期開發(新手駕駛)

使用少量 MCP(1~2 個核心工具即可)。

CLAUDE.md 保持精簡,僅放核心規則。

2. 中期專案(進階駕駛

模組化 MCP,根據需求載入。

CLAUDE.md 分段管理,依任務呼叫。


3. 大型專案(專業賽車手

建立 Token 成本監控(如每日報表)。

定期壓縮 CLAUDE.md,並透過 MCP 工具做檢索,而不是全量載入。

結語

就像開車一樣:
• 想要方便,就上自排(多 MCP + 大 CLAUDE.md),但要忍受油耗高。
• 想要高效,就練手排(少 MCP + 精簡 CLAUDE.md),需要更多心力切換。

最佳策略是「混合駕駛」:該手排時手排,該自排時自排。
開發團隊應該隨時檢視 token 成本,靈活調整 MCP 數量與 CLAUDE.md 規模,才能在效率與成本之間找到平衡。

沒有留言 :