❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

项目介绍快速开始学习路径项目截图 3 贡献者 75 增长趋势 Commit 历史代码统计生态关系项目时间线项目竞品依赖分析上榜历史

datawhalechina/self-llm

Jupyter Notebook 活跃

555

最后更新2026-07-04

31k

+17

项目介绍

《开源大模型食用指南》针对中国开发者定制的Linux环境快速微调（全参数/Lora）、部署国内外开源大模型（LLM）/多模态大模型（MLLM）教程

《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调（全参数/Lora）、部署国内外开源大模型（LLM）/多模态大模型（MLLM）教程

智能解读

点击生成更详细的项目介绍

正在分析项目...

原始标签

chatglm chatglm3 gemma-2b-it glm-4 internlm2 llama3 llm lora minicpm q-wen qwen qwen1-5 qwen2

智能标签

生成技术栈、用途、特征、受众等多维度标签

使用场景

使用场景自动生成

最适合需要从零开始学习开源大模型部署、微调和应用的中国开发者，尤其是学生和研究者，提供一站式Linux环境下的全流程实战教程

本地部署开源LLM

想体验或使用ChatGLM、Qwen等开源大模型，但缺乏Linux环境配置和部署经验

项目提供针对不同模型的详细Linux环境配置步骤和本地部署教程，包括命令行调用和在线Demo搭建

学生想在个人服务器上运行Qwen2模型进行文本生成，按照教程完成环境配置后，通过几行命令即可启动模型服务并调用

低成本微调专属模型

需要针对特定领域（如客服、教育）微调大模型，但GPU资源有限，不懂LoRA等高效微调技术

项目提供全参数和LoRA微调教程，覆盖Qwen、InternLM等主流模型，指导在消费级GPU上完成高效微调

开发者想用《甄嬛传》台词微调一个角色对话模型，参考项目中的Chat-嬛嬛案例，使用LoRA在单卡GPU上完成训练

集成LangChain应用开发

想将开源LLM接入LangChain框架构建RAG或Agent应用，但不知如何配置和调用

项目包含LangChain框架集成教程，展示如何将本地部署的模型封装为可调用的API，并嵌入到应用流程中

构建一个知识库问答系统，按照教程将Qwen模型部署后，通过LangChain加载本地文档并实现检索增强生成

多模型对比与快速上手

面对众多开源模型（LLaMA、ChatGLM、InternLM等），不知如何选择，且每个模型环境配置各异

项目提供50+模型的统一教程结构，从环境配置到部署微调全覆盖，方便快速对比和切换不同模型

研究人员想评估Qwen3和DeepSeek-R1在数学推理上的表现，参考项目教程分别部署两个模型，并测试相同问题

项目健康度

74/100

良好

活跃度 15/23

距上次更新 29 天

人气 25/25

平台 Star TOP 2% · Forks 3,046

增长 15/25

本周 +103 ⭐ · 本月 +412 ⭐

社区 11/17

75 位贡献者 · 0 条平台评论

文档 8/10

缺少 1 项内容

在 GitHub 上查看

项目信息

作者 datawhalechina

来源 GitHub

周期每日

仓库ID datawhalechina/self-llm

最新提交 2026-06-17 05:54:51

第一收录 2026-07-05 08:25:54

最后更新 2026-07-05 08:25:54

赞赏支持

如果本站对你有帮助，欢迎打赏支持

微信

支付宝

Widget 徽章

预览

Markdown

HTML

登录后发表评论

加载评论中...