lora
话题找到数量
datawhalechina/self-llm
《开源大模型食用指南》针对中国开发者定制的Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程
29k
2.9k
198
+997
modelscope/ms-swift
使用PEFT或全参数方法对500余个大语言模型和200余个多模态大语言模型进行CPT/SFT/DPO/GRPO训练
12k
1.2k
139
+26
OpenPipe/ART
智能体强化训练器:使用GRPO为现实任务训练多步智能体。为智能体提供在职培训。支持Qwen2.5、Qwen3、Llama等模型的强化学习
8.5k
699
173
+85