摆脱token限制:本地部署Ollama并通过Nginx代理实现外网简单调用
前言 最近写代码有点多,整体框架会用Gemini生成,后续自己修正想增加一点代码自动补全的功能,于是搜索了一下,得出的结论就是代码自动补全本身非常轻量,最高优先级是本地设备跑,延迟低,响应快,于是就抱着试试的态度自己在本地搭建Ollma。 最终选择在家庭NAS上面部署Ollma,选择相对轻量的 qwen2.5-coder 模型,并通过nginx反向代理,外网一样可以使用。 模型选择 速度方案:qw […]
摆脱token限制:本地部署Ollama并通过Nginx代理实现外网简单调用 阅读更多»