未找到匹配的日期
🏷️
#reinforcement-learning 每月趋势报告
📅
2026-03
📊
4 个项目
🔥 #reinforcement-learning 每月热门项目
unslothai/unsloth
大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存
58k
5k
315
+6.1k
NVIDIA-NeMo/Nemotron
NVIDIA Nemotron 开发者资源中心——提供训练方案、使用指南及完整端到端参考示例的一站式资源库,助力基于Nemotron模型的开发。
827
175
111
+395
📊 数据统计
4
个热门项目
2026-03
数据日期
🔥 TrendForge - 追踪开源项目热度,发现技术趋势