项目竞品

共找到 18 个竞品
thu-ml

thu-ml/tianshou

9.9k 1.2k

一个优雅的PyTorch深度强化学习库。

Python ddpg double-dqn dqn imitation-learning policy-gradient +2
相似度
50%
+572
AI4Finance-Foundation

AI4Finance-Foundation/FinGPT

18.7k 2.6k

FinGPT:开源金融大语言模型!我们发布革命性🔥训练模型于HuggingFace平台

Jupyter Notebook reinforcement-learning
相似度
7%
+16
AI4Finance-Foundation

AI4Finance-Foundation/FinRL

14.0k 3.1k

FinRL®:金融强化学习框架。🔥

Jupyter Notebook deep-reinforcement-learning
相似度
7%
+62
MITDeepLearning

MITDeepLearning/introtodeeplearning

8.5k 4.4k

麻省理工学院6.S191课程实验材料:深度学习导论

Jupyter Notebook deep-reinforcement-learning
相似度
7%
+7
rasbt

rasbt/reasoning-from-scratch

2.8k 398

使用PyTorch从零开始逐步实现一个推理大语言模型

Jupyter Notebook reinforcement-learning
相似度
7%
+29
AI4Finance-Foundation

AI4Finance-Foundation/FinRL-Trading

2.7k 850

用于交易。请点星支持。

Python ddpg deep-reinforcement-learning ppo
相似度
21%
+12
Lifelong-Robot-Learning

Lifelong-Robot-Learning/LIBERO

1.5k 316

终身机器人学习中的知识迁移基准测试

Jupyter Notebook imitation-learning
相似度
7%
+5
Unity-Technologies

Unity-Technologies/ml-agents

19.1k 4.4k

Unity机器学习代理工具包(ML-Agents)是一个开源项目,能让游戏和模拟场景成为训练智能代理的环境,支持深度强化学习与模仿学习。

C# deep-reinforcement-learning reinforcement-learning
相似度
14%
+31
carla-simulator

carla-simulator/carla

13.5k 4.4k

开源自动驾驶研究模拟器

C++ deep-reinforcement-learning imitation-learning
相似度
14%
+37
huggingface

huggingface/deep-rl-class

4.8k 776

该仓库包含Hugging Face的深度强化学习课程。

MDX deep-reinforcement-learning reinforcement-learning
相似度
14%
+19
enactic

enactic/openarm

1.8k 193

用于接触密集型环境中物理AI研究和部署的全开源仿人机械臂

MDX imitation-learning reinforcement-learning
相似度
14%
+108
unslothai

unslothai/unsloth

52.6k 4.4k

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

Python reinforcement-learning
相似度
7%
+538
sgl-project

sgl-project/sglang

23.4k 4.3k

SGLang是面向大语言模型与视觉语言模型的高速推理框架。

Python reinforcement-learning
相似度
7%
+128
microsoft

microsoft/agent-lightning

15.0k 1.3k

点亮AI智能体的终极训练器

Python reinforcement-learning
相似度
7%
+1.5k
OpenPipe

OpenPipe/ART

8.5k 699

智能体强化训练器:使用GRPO为现实任务训练多步智能体。为智能体提供在职培训。支持Qwen2.5、Qwen3、Llama等模型的强化学习

Python reinforcement-learning
相似度
7%
+85
PufferAI

PufferAI/PufferLib

5.0k 389

简化复杂游戏环境中的强化学习实现

C reinforcement-learning
相似度
7%
+14
google-deepmind

google-deepmind/open_spiel

5.0k 1.1k

OpenSpiel是一个用于通用强化学习及游戏搜索与规划研究的游戏环境与算法集合。

C++ reinforcement-learning
相似度
7%
+2
HenryHuYu

HenryHuYu/DiffPhysDrone

461 71

发表于《自然·机器智能》!首个基于可微分物理训练的实体机器人(四旋翼飞行器)。

Cuda reinforcement-learning
相似度
7%
+45
助手