2026-03
🏷️

#reinforcement-learning 每月趋势报告

📅 2026-03
📊 4 个项目

🔥 #reinforcement-learning 每月热门项目

unslothai/unsloth

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

58k
5k
315
+6.1k
排名 #16
3月31日
查看详情

AI4Finance-Foundation/FinRL

FinRL®:金融强化学习框架。🔥

14k
3.2k
235
+608
排名 #12
3月31日
查看详情

NVIDIA-NeMo/Nemotron

NVIDIA Nemotron 开发者资源中心——提供训练方案、使用指南及完整端到端参考示例的一站式资源库,助力基于Nemotron模型的开发。

827
175
111
+395
排名 #8
3月31日
查看详情

enactic/openarm

用于接触密集型环境中物理AI研究和部署的全开源仿人机械臂

2k
214
209
+191
排名 #2
3月31日
查看详情

📊 数据统计

4 个热门项目
2026-03 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手