2026-01-29
🏷️

#reinforcement-learning 每日趋势报告

📅 2026-01-29
📊 3 个项目

🔥 #reinforcement-learning 每日热门项目

OpenPipe/ART

智能体强化训练器:使用GRPO为现实任务训练多步智能体。为智能体提供在职培训。支持Qwen2.5、Qwen3、Llama等模型的强化学习

8.5k
696
61
+85
排名 #4
1月29日
查看详情

enactic/openarm

用于接触密集型环境中物理AI研究和部署的全开源仿人机械臂

1.7k
186
63
+4
排名 #11
1月29日
查看详情

huggingface/deep-rl-class

该仓库包含Hugging Face的深度强化学习课程。

4.7k
772
73
+3
排名 #13
1月29日
查看详情

📊 数据统计

3 个热门项目
2026-01-29 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手