許一個自己定義的第三人生
網頁
返回首頁
實戰教學:Gemini CLI v0.40.0 以上的本地 Gemma 系統初步部署與踩坑紀錄
前言
隨著 Gemini 3 的發佈,Gemini CLI 的「Auto」模式已成為開發者的最愛,它能自動在 Pro 與 Flash 模型間切換。但最前衛的玩法是:讓本地的 Gemma 模型來決定路由。
為什麼要這麼做?
極低延遲:本地 1B 模型判斷任務複雜度僅需不到
100ms
。
隱私保護:任務分類的決策過程完全在本地完成。
節省資源:透過精準的分類,確保只有真正困難的任務才會呼叫昂貴的 Pro 模型。
在 Gemini CLI v0.40.0 的更新中,官方導入了分層記憶體(Tiered Memory)與本地模型路由功能,讓我們用短短幾行指令,就能將雲端的請求切換到本機的 Gemma 模型來處理。
閱讀更多 »
較新的文章
較舊的文章
首頁
訂閱:
文章 (Atom)