lora
共找到 10 个相关项目
datawhalechina/self-llm
《开源大模型食用指南》针对中国开发者定制的Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程
28k
2.8k
72
+997
OpenPipe/ART
智能体强化训练器:使用GRPO为现实任务训练多步智能体。为智能体提供在职培训。支持Qwen2.5、Qwen3、Llama等模型的强化学习
8.5k
699
61
+85