你愛手排車 vs 自排車 - 談 Token 消耗管理，如何平衡 Claude Code 的 MCP & Rule 數量

2025年9月10日星期三

你愛手排車 vs 自排車 - 談 Token 消耗管理，如何平衡 Claude Code 的 MCP & Rule 數量

前陣子收集了許多大神的 Claude.md 就一股腦的放進去(好啦還是有整理一下)，又時不時地看到什麼很厲害的 MCP 又出了，趕快來裝一下，就讓我們產生了一種幻覺「多串 MCP 工具、多放 claude.md，可以讓開發更方便」，但實際使用下來，你會發現 token 消耗與效能延遲才是真正的瓶頸。這就像開車：

自排車（自動）：方便，踩油門就能跑，但油耗通常比較高。
手排車（手動）：需要更細膩的操作，雖然麻煩一點，但能更精準控制油耗與性能。

用的越兇，越有這種感覺，使用 Claude Code 串接 MCP & Rule，就是在這兩者之間做取捨。

以 Token 消耗的「油耗」比喻

1. 工具描述自動注入（空轉油耗）

就像一台自排車掛在 D 檔，雖然沒動，但油門踩下去一樣耗油。每次載入 MCP 工具描述時，初始就會消耗 1～2 萬 tokens 。

2. 腫大 CLAUDE.md（加強安全，過重載貨）

覺得多加一點 rule 就能讓 LLM 乖乖地的開發，但是一不小心就放太多 context，就像塞滿後車廂和裝了又重又厚的防撞鋼板，每次加速都更吃力。此外一個大專案可能每輪對話就耗掉 3～5 萬 tokens 。

3. 反應延遲（起步頓挫）

太多 context 預載，會拖慢首字回應（2～8 秒不等），像手排沒控制好半離合的卡頓感，就算切了 subagent 號稱可以省 context ，需要時才 load 進來執行，但是實際上沒有像大家說的那麼順暢

Best Practices - 像開手排一樣切換?

1. MCP 數量控制 = 擋位切換

少即是多：就像低速擋能上坡，但不可能一路 1 擋跑高速。MCP 工具不是越多越好，而是根據專案需求來選擇。

模組化啟用：建議拆成不同 MCP 套件，只有在需要時才掛上去，而不是一次全開。

模組化專案：這時候 mono repo 感覺就不太好用，簡單的邏輯和固定的功能，最好都能模組化，改用 lib 的方式 include 近來，分開開發。不過這到底算不算是因噎廢食呢?

2. CLAUDE.md 設計 = 輕量車體

切分模組：避免一份 claude.md 塞爆所有內容，可以依專案或功能拆分。

語法隔離：使用分隔語法，降低 context 污染，就像隔離不同檔位的動力輸出。

3. 成本監控 = 油錶習慣

/cost 指令：養成隨時看 token 用量的習慣，就像開車隨時瞄油錶，不過這是使用 API 得習慣，用 Claude code Pro 就是莫名燒光被降級….只能在 model 間切換。

月度試算：以API 搭配其他 IDE 介面來說中度團隊一天 10 輪互動，月成本大約 $15～25 美金；重度專案可達 $50～80 美金，要重新開始抓感覺，建議可以安裝 https://github.com/chiphuyen/sniffly 來分析一下你的花費都在哪些動作。

4. 批次操作 = 長途定速

批次提問：避免零碎多輪的消耗，把需求打包成批次，減少對話增加文件交流，像定速巡航一樣省力。

上下文壓縮：將歷史記憶整理摘要，避免每次都重複載入。

實際建議流程

1. 初期開發（新手駕駛）

使用少量 MCP（1～2 個核心工具即可）。

CLAUDE.md 保持精簡，僅放核心規則。

2. 中期專案（進階駕駛）

模組化 MCP，根據需求載入。

CLAUDE.md 分段管理，依任務呼叫。

3. 大型專案（專業賽車手）

建立 Token 成本監控（如每日報表）。

定期壓縮 CLAUDE.md，並透過 MCP 工具做檢索，而不是全量載入。

結語

就像開車一樣：
• 想要方便，就上自排（多 MCP + 大 CLAUDE.md），但要忍受油耗高。
• 想要高效，就練手排（少 MCP + 精簡 CLAUDE.md），需要更多心力切換。

最佳策略是「混合駕駛」：該手排時手排，該自排時自排。
開發團隊應該隨時檢視 token 成本，靈活調整 MCP 數量與 CLAUDE.md 規模，才能在效率與成本之間找到平衡。