❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

项目介绍快速开始学习路径项目截图 3 贡献者 33 增长趋势 Commit 历史代码统计生态关系项目时间线项目竞品依赖分析上榜历史

mostlygeek/llama-swap

Go 活跃

277

最后更新2026-05-16

4.1k

+23

#10

316

项目介绍

llama.cpp（或任何兼容本地OpenAI API的服务器）的模型热替换

Reliable model swapping for any local OpenAI/Anthropic compatible server - llama.cpp, vllm, etc

智能解读

智能解读自动生成

llama-swap 是一个用 Go 语言编写的高性能工具，旨在管理运行在本地的生成式 AI 模型。它充当一个智能代理服务器，能够无缝连接并热切换多个兼容 OpenAI API 的本地推理服务，例如 llama.cpp、vLLM 或 TabbyAPI。用户只需一个可执行文件和配置文件即可快速部署，无需复杂依赖。其核心价值在于实现了“模型即服务”的灵活管理。用户可以预先配置好多个不同用途的模型，在实际调用时，只需在请求中指定目标模型名称，llama-swap 便会自动将请求路由到对应的后端服务，并支持按需加载和卸载模型以节省资源。这极大地简化了在单台机器上构建多模型AI工作流的复杂度，适用于开发测试、研究实验或需要灵活切换不同AI能力的本地应用场景。