❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

datawhalechina

datawhalechina/self-llm

Jupyter Notebook 一般
357
2026-05-10
30k
+21
#18
3k

项目介绍

《开源大模型食用指南》针对中国开发者定制的Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程

《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程

智能解读

点击生成更详细的项目介绍

智能标签

生成技术栈、用途、特征、受众等多维度标签

使用场景

使用场景 自动生成

最适合需要从零开始学习开源大模型部署、微调和应用的中国开发者,尤其是学生和研究者,提供一站式Linux环境下的全流程实战教程

1

本地部署开源LLM

想体验或使用ChatGLM、Qwen等开源大模型,但缺乏Linux环境配置和部署经验

项目提供针对不同模型的详细Linux环境配置步骤和本地部署教程,包括命令行调用和在线Demo搭建

学生想在个人服务器上运行Qwen2模型进行文本生成,按照教程完成环境配置后,通过几行命令即可启动模型服务并调用

2

低成本微调专属模型

需要针对特定领域(如客服、教育)微调大模型,但GPU资源有限,不懂LoRA等高效微调技术

项目提供全参数和LoRA微调教程,覆盖Qwen、InternLM等主流模型,指导在消费级GPU上完成高效微调

开发者想用《甄嬛传》台词微调一个角色对话模型,参考项目中的Chat-嬛嬛案例,使用LoRA在单卡GPU上完成训练

3

集成LangChain应用开发

想将开源LLM接入LangChain框架构建RAG或Agent应用,但不知如何配置和调用

项目包含LangChain框架集成教程,展示如何将本地部署的模型封装为可调用的API,并嵌入到应用流程中

构建一个知识库问答系统,按照教程将Qwen模型部署后,通过LangChain加载本地文档并实现检索增强生成

4

多模型对比与快速上手

面对众多开源模型(LLaMA、ChatGLM、InternLM等),不知如何选择,且每个模型环境配置各异

项目提供50+模型的统一教程结构,从环境配置到部署微调全覆盖,方便快速对比和切换不同模型

研究人员想评估Qwen3和DeepSeek-R1在数学推理上的表现,参考项目教程分别部署两个模型,并测试相同问题

项目健康度

B
67/100
良好
活跃度人气增长社区文档
活跃度 10/23

距上次更新 31 天

人气 25/25

平台 Star TOP 2% · Forks 2,988

增长 13/25

本周 +109 ⭐ · 本月 +899 ⭐

社区 11/17

75 位贡献者 · 0 条平台评论

文档 8/10

缺少 1 项内容

在 GitHub 上查看

项目信息

来源 GitHub
周期 每日
仓库ID datawhalechina/self-llm
最新提交 2026-04-24 13:50:47
第一收录 2026-05-11 08:02:27
最后更新 2026-05-12 16:47:00

赞赏支持

如果本站对你有帮助,欢迎打赏支持

微信打赏码

微信

支付宝打赏码

支付宝

评论 0

登录 后发表评论

加载评论中...

助手