網頁

實戰教學:Gemini CLI v0.40.0 以上的本地 Gemma 系統初步部署與踩坑紀錄

前言


隨著 Gemini 3 的發佈,Gemini CLI 的「Auto」模式已成為開發者的最愛,它能自動在 Pro 與 Flash 模型間切換。但最前衛的玩法是:讓本地的 Gemma 模型來決定路由。

為什麼要這麼做?
  • 極低延遲:本地 1B 模型判斷任務複雜度僅需不到 100ms
  • 隱私保護:任務分類的決策過程完全在本地完成。
  • 節省資源:透過精準的分類,確保只有真正困難的任務才會呼叫昂貴的 Pro 模型。
在 Gemini CLI v0.40.0 的更新中,官方導入了分層記憶體(Tiered Memory)與本地模型路由功能,讓我們用短短幾行指令,就能將雲端的請求切換到本機的 Gemma 模型來處理。