前陣子收集了許多大神的 Claude.md 就一股腦的放進去(好啦還是有整理一下),又時不時地看到什麼很厲害的 MCP 又出了,趕快來裝一下,就讓我們產生了一種幻覺「多串 MCP 工具、多放 claude.md,可以讓開發更方便」,但實際使用下來,你會發現 token 消耗與效能延遲才是真正的瓶頸。這就像開車:
自排車(自動):方便,踩油門就能跑,但油耗通常比較高。
手排車(手動):需要更細膩的操作,雖然麻煩一點,但能更精準控制油耗與性能。
用的越兇,越有這種感覺,使用 Claude Code 串接 MCP & Rule,就是在這兩者之間做取捨。
以 Token 消耗的「油耗」比喻
1. 工具描述自動注入(空轉油耗)
就像一台自排車掛在 D 檔,雖然沒動,但油門踩下去一樣耗油。每次載入 MCP 工具描述時,初始就會消耗 1~2 萬 tokens 。
2. 腫大 CLAUDE.md(加強安全,過重載貨)
覺得多加一點 rule 就能讓 LLM 乖乖地的開發,但是一不小心就放太多 context,就像塞滿後車廂和裝了又重又厚的防撞鋼板,每次加速都更吃力。此外一個大專案可能每輪對話就耗掉 3~5 萬 tokens 。
3. 反應延遲(起步頓挫)
太多 context 預載,會拖慢首字回應(2~8 秒不等),像手排沒控制好半離合的卡頓感 ,就算切了 subagent 號稱可以省 context ,需要時才 load 進來執行,但是實際上沒有像大家說的那麼順暢
Best Practices - 像開手排一樣切換?
1. MCP 數量控制 = 擋位切換
少即是多:就像低速擋能上坡,但不可能一路 1 擋跑高速。MCP 工具不是越多越好,而是根據專案需求來選擇。
模組化啟用:建議拆成不同 MCP 套件,只有在需要時才掛上去,而不是一次全開。
模組化專案:這時候 mono repo 感覺就不太好用,簡單的邏輯和固定的功能,最好都能模組化,改用 lib 的方式 include 近來,分開開發。不過這到底算不算是因噎廢食呢?
2. CLAUDE.md 設計 = 輕量車體
切分模組:避免一份 claude.md 塞爆所有內容,可以依專案或功能拆分。
語法隔離:使用分隔語法,降低 context 污染,就像隔離不同檔位的動力輸出 。
3. 成本監控 = 油錶習慣
/cost 指令:養成隨時看 token 用量的習慣,就像開車隨時瞄油錶 ,不過這是使用 API 得習慣,用 Claude code Pro 就是莫名燒光被降級….只能在 model 間切換。
月度試算:以API 搭配其他 IDE 介面來說中度團隊一天 10 輪互動,月成本大約 $15~25 美金;重度專案可達 $50~80 美金,要重新開始抓感覺,建議可以安裝 https://github.com/chiphuyen/sniffly 來分析一下你的花費都在哪些動作。
4. 批次操作 = 長途定速
批次提問:避免零碎多輪的消耗,把需求打包成批次,減少對話增加文件交流,像定速巡航一樣省力。
上下文壓縮:將歷史記憶整理摘要,避免每次都重複載入。
實際建議流程
1. 初期開發(新手駕駛)
使用少量 MCP(1~2 個核心工具即可)。
CLAUDE.md 保持精簡,僅放核心規則。
2. 中期專案(進階駕駛)
模組化 MCP,根據需求載入。
CLAUDE.md 分段管理,依任務呼叫。
3. 大型專案(專業賽車手)
建立 Token 成本監控(如每日報表)。
定期壓縮 CLAUDE.md,並透過 MCP 工具做檢索,而不是全量載入。
結語
就像開車一樣:
• 想要方便,就上自排(多 MCP + 大 CLAUDE.md),但要忍受油耗高。
• 想要高效,就練手排(少 MCP + 精簡 CLAUDE.md),需要更多心力切換。
最佳策略是「混合駕駛」:該手排時手排,該自排時自排。
開發團隊應該隨時檢視 token 成本,靈活調整 MCP 數量與 CLAUDE.md 規模,才能在效率與成本之間找到平衡。


沒有留言:
張貼留言