项目竞品项目
meta-llama/llama-cookbook
欢迎来到Llama实践指南!这是您使用Llama进行开发的必备指南:涵盖推理入门、微调及RAG技术。我们还将展示如何利用Llama模型家族解决端到端问题,并在不同云服务平台上进行部署
lyogavin/airllm
使用单张4GB GPU实现AirLLM 70B推理
sgl-project/sglang
SGLang是面向大语言模型与视觉语言模型的高速推理框架。
mudler/LocalAI
🤖 开源免费的OpenAI、Claude及其他AI平台的替代方案。支持自主托管且本地优先,可作为OpenAI的即插即用替代方案运行于消费级硬件,无需GPU。兼容gguf、transformers、diffusers等多种模型架构。功能包括:文本生成、音频处理、视频制作、图像生成、语音克隆、分布式点对点推理。
AstrBotDevs/AstrBot
集成多款即时通讯平台、大语言模型、插件及AI功能的智能聊天机器人基础设施,可作为OpenClaw的替代方案。✨
yamadashy/repomix
📦 Repomix 是一款强大工具,可将您的整个代码库打包成单一且适配 AI 处理的文件。非常适合需要将代码库输入大型语言模型或其他 AI 工具的场景,例如 Claude、ChatGPT、DeepSeek、Perplexity、Gemini、Gemma、Llama、Grok 等。
modelscope/ms-swift
使用PEFT或全参数方法对500余个大语言模型和200余个多模态大语言模型进行CPT/SFT/DPO/GRPO训练
langchain4j/langchain4j
LangChain的Java实现版本
cheahjs/free-llm-api-resources
可通过 API 访问的免费大语言模型推理资源列表
dataelement/bisheng
毕昇是面向新一代企业AI应用的开源大语言模型运维平台,提供强大全面的功能:GenAI工作流、RAG、智能体、统一模型管理、评估监督、监督微调、数据集管理、企业级系统管理、可观测性等
tensorzero/tensorzero
TensorZero是工业级LLM应用的开源技术栈,整合了LLM网关、可观测性、优化、评估与实验功能。
NexaAI/nexa-sdk
通过Python、Android Java和iOS Swift绑定,在GPU、NPU和CPU上运行最新的LLM和VLM模型,快速部署OpenAI gpt-oss、Gemma 3、Qwen3等主流模型。
strands-agents/sdk-python
一种模型驱动的方法,仅需几行代码即可构建 AI 智能体。
vllm-project/vllm
面向大语言模型的高吞吐量与内存优化型推理服务引擎
hiyouga/LlamaFactory
百款大语言模型与视觉语言模型的统一高效微调框架(ACL 2024)
unslothai/unsloth
大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存
ollama/ollama
开始使用OpenAI gpt-oss、DeepSeek-R1、Gemma 3及其他模型。
huggingface/transformers
🤗 Transformers:面向文本、视觉、音频及多模态模型的尖端机器学习模型定义框架,支持推理与训练全流程。
相关项目推荐
jackfrued/Python-100-Days
Python - 100天从新手到大师
langchain-ai/langchain
🦜🔗 构建情境感知推理应用程序 🦜🔗
microsoft/generative-ai-for-beginners
21堂课带你入门生成式AI开发
rasbt/LLMs-from-scratch
使用PyTorch从零开始逐步实现类ChatGPT大型语言模型
microsoft/ML-For-Beginners
12周、26节课、52个测验,面向所有人的经典机器学习课程
CompVis/stable-diffusion
潜在文本到图像扩散模型