- Forever Young

摆脱token限制：本地部署Ollama并通过Nginx代理实现外网简单调用

个人随笔 / 04/07/2026 / Ollama, token

前言最近写代码有点多，整体框架会用Gemini生成，后续自己修正想增加一点代码自动补全的功能，于是搜索了一下，得出的结论就是代码自动补全本身非常轻量，最高优先级是本地设备跑，延迟低，响应快，于是就抱着试试的态度自己在本地搭建Ollma。最终选择在家庭NAS上面部署Ollma，选择相对轻量的 qwen2.5-coder 模型，并通过nginx反向代理，外网一样可以使用。模型选择速度方案：qw […]

摆脱token限制：本地部署Ollama并通过Nginx代理实现外网简单调用阅读更多»