前言
隨著 Gemini 3 的發佈,Gemini CLI 的「Auto」模式已成為開發者的最愛,它能自動在 Pro 與 Flash 模型間切換。但最前衛的玩法是:讓本地的 Gemma 模型來決定路由。
為什麼要這麼做?
- 極低延遲:本地 1B 模型判斷任務複雜度僅需不到 100ms。
- 隱私保護:任務分類的決策過程完全在本地完成。
- 節省資源:透過精準的分類,確保只有真正困難的任務才會呼叫昂貴的 Pro 模型。
以下是本次初步部署的實戰紀錄,包含完整的啟動步驟,以及在 Windows 環境下可能會遇到的通訊埠(Port)衝突與解決方案。
一、 快速啟動與部署
Gemini CLI 將複雜的環境設定大幅簡化。確保您已經安裝好最新版(v0.40.0 以上)的 Gemini CLI 後,開啟終端機(如 PowerShell 或命令提示字元),依序輸入以下指令:
Gemini CLI 將複雜的環境設定大幅簡化。確保您已經安裝好最新版(v0.40.0 以上)的 Gemini CLI 後,開啟終端機(如 PowerShell 或命令提示字元),依序輸入以下指令:
- 下載並設定本地 Gemma 模型路由環境
gemini gemma setup - 啟動背景的 LiteRT-LM 伺服器
gemini gemma start
二、 常見錯誤與排除(Windows 踩坑紀錄)狀況 1:Port 9379 存取被拒 (Forbidden)
Error:
這通常發生在裝有 Docker 或 Hyper-V 的 Windows 系統中。Windows 的 NAT 服務(winnat)會隨機保留某些通訊埠區段供系統使用。如果 9379 剛好被劃入保留區,就會直接被拒絕存取。
解法:重啟 winnat 服務讓系統重新分配通訊埠
三、 驗證測試:模型真的在我的本機跑起來了嗎?
以系統管理員身分開啟終端機(如 PowerShell 或命令提示字元),輸入以下指令:
以系統管理員身分開啟終端機(如 PowerShell 或命令提示字元),輸入以下指令:
本文的技術探討源自於 Jack Wotherspoon 於 X (Twitter) 發布的 Gemini CLI v0.40.0 重大更新消息。官方在此版本中正式推出了「本地 Gemma 系統的首波部署(Local Gemma for Model Routing)」。
原始來源網址:Jack Wotherspoon X Post
Error:
listen tcp :9379: bind: An attempt was made to access a socket in a way forbidden
by its access permissions.原因:這通常發生在裝有 Docker 或 Hyper-V 的 Windows 系統中。Windows 的 NAT 服務(winnat)會隨機保留某些通訊埠區段供系統使用。如果 9379 剛好被劃入保留區,就會直接被拒絕存取。
解法:重啟 winnat 服務讓系統重新分配通訊埠
- 以系統管理員身分開啟終端機 (cmd / PowerShell)。
- 輸入以下指令停止服務:
net stop winnat - 輸入以下指令重新啟動服務:
net start winnat - 再次執行
gemini gemma start即可順利綁定通訊埠。
以系統管理員身分開啟終端機(如 PowerShell 或命令提示字元),輸入以下指令:
gemini gemma status看到以下資訊就是成功了Gemma Local Model Routing Status
────────────────────────────────────────
Binary: ✓ Installed (C:\Users\user\.gemini\bin\litert\lit.windows_x86_64.exe)
Model: ✓ gemma3-1b-gpu-custom downloaded
Server: ✓ Running on port 9379
Settings: ✓ Enabled in settings.json
Routing is active — no action needed.
Simple requests → Flash (fast) | Complex requests → Pro (powerful)
This happens automatically on every request.這就證明了——您的本地 Gemma 系統已經完美接管任務,正使用您的本機算力為您服務!運作機制為:- SIMPLE 任務:如「解釋這行代碼」,本地 Gemma 判斷後直接導向 Flash。
- COMPLEX 任務:如「重構此模組」,本地 Gemma 判斷後導向 Pro。
gemini gemma 相關指令:以系統管理員身分開啟終端機(如 PowerShell 或命令提示字元),輸入以下指令:
gemini gemma -h可以看到以下 gemini gemma 相關資訊:----------------------------------------------------------------------------------
gemini gemma
Manage local Gemma model routing
Commands:
gemini gemma setup Download and configure Gemma local model routing
gemini gemma start Start the LiteRT-LM server
gemini gemma stop Stop the LiteRT-LM server
gemini gemma status Check Gemma local model routing status
gemini gemma logs View LiteRT-LM server logs
Options:
-d, --debug Run in debug mode (open debug console with F12)
-h, --help Show help
---------------------------------------------------------------------------------📌 參考資料與資訊來源本文的技術探討源自於 Jack Wotherspoon 於 X (Twitter) 發布的 Gemini CLI v0.40.0 重大更新消息。官方在此版本中正式推出了「本地 Gemma 系統的首波部署(Local Gemma for Model Routing)」。
原始來源網址:Jack Wotherspoon X Post

沒有留言:
張貼留言