2026-01-30
🏷️

#reinforcement-learning 每日趋势报告

📅 2026-01-30
📊 3 个项目

🔥 #reinforcement-learning 每日热门项目

OpenPipe/ART

智能体强化训练器:使用GRPO为现实任务训练多步智能体。为智能体提供在职培训。支持Qwen2.5、Qwen3、Llama等模型的强化学习

8.5k
699
60
+25
排名 #4
1月30日
查看详情

huggingface/deep-rl-class

该仓库包含Hugging Face的深度强化学习课程。

4.7k
773
66
+6
排名 #13
1月30日
查看详情

enactic/openarm

用于接触密集型环境中物理AI研究和部署的全开源仿人机械臂

1.7k
187
53
+4
排名 #11
1月30日
查看详情

📊 数据统计

3 个热门项目
2026-01-30 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手