qwen3-next

话题找到数量

modelscope/ms-swift

使用PEFT或全参数方法对500余个大语言模型和200余个多模态大语言模型进行CPT/SFT/DPO/GRPO训练

12k
1.2k
179
+26
排名 #9
2月27日
查看详情

NVIDIA-NeMo/Automodel

专为大语言模型/视觉语言模型设计的PyTorch分布式原生训练库,开箱即用支持Hugging Face

321
70
213
+4
排名 #5
2月18日
查看详情
助手