reinforcement-learning

共找到 17 个相关项目

unslothai/unsloth

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

52k
4.4k
133
+538
排名 #19
2月22日
查看详情

sgl-project/sglang

SGLang是面向大语言模型与视觉语言模型的高速推理框架。

23k
4.3k
121
+128
排名 #9
2月6日
查看详情

Unity-Technologies/ml-agents

Unity机器学习代理工具包(ML-Agents)是一个开源项目,能让游戏和模拟场景成为训练智能代理的环境,支持深度强化学习与模仿学习。

19k
4.4k
74
+31
排名 #15
1月25日
查看详情

AI4Finance-Foundation/FinGPT

FinGPT:开源金融大语言模型!我们发布革命性🔥训练模型于HuggingFace平台

18k
2.6k
50
+16
排名 #15
2月23日
查看详情

microsoft/agent-lightning

点亮AI智能体的终极训练器

15k
1.3k
71
+1.5k
排名 #13
2月19日
查看详情

AI4Finance-Foundation/FinRL

FinRL®:金融强化学习框架。🔥

14k
3.1k
111
+62
排名 #18
2月23日
查看详情

datawhalechina/easy-rl

强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/

13k
2.2k
79
+14
排名 #18
2月14日
查看详情

carla-simulator/carla

开源自动驾驶研究模拟器

13k
4.4k
102
+37
排名 #20
1月25日
查看详情

OpenPipe/ART

智能体强化训练器:使用GRPO为现实任务训练多步智能体。为智能体提供在职培训。支持Qwen2.5、Qwen3、Llama等模型的强化学习

8.5k
699
60
+85
排名 #4
1月30日
查看详情

MITDeepLearning/introtodeeplearning

麻省理工学院6.S191课程实验材料:深度学习导论

8.5k
4.4k
77
+7
排名 #11
2月10日
查看详情

PufferAI/PufferLib

简化复杂游戏环境中的强化学习实现

5k
389
69
+14
排名 #12
2月8日
查看详情

google-deepmind/open_spiel

OpenSpiel是一个用于通用强化学习及游戏搜索与规划研究的游戏环境与算法集合。

5k
1.1k
50
+2
排名 #8
1月23日
查看详情

huggingface/deep-rl-class

该仓库包含Hugging Face的深度强化学习课程。

4.8k
776
64
+19
排名 #19
2月20日
查看详情

rasbt/reasoning-from-scratch

使用PyTorch从零开始逐步实现一个推理大语言模型

2.8k
398
71
+29
排名 #11
2月3日
查看详情

AI4Finance-Foundation/FinRL-Trading

用于交易。请点星支持。

2.7k
850
66
+12
排名 #10
1月24日
查看详情

enactic/openarm

用于接触密集型环境中物理AI研究和部署的全开源仿人机械臂

1.8k
192
53
+108
排名 #22
2月21日
查看详情

HenryHuYu/DiffPhysDrone

发表于《自然·机器智能》!首个基于可微分物理训练的实体机器人(四旋翼飞行器)。

461
71
45
+45
排名 #14
2月13日
查看详情
助手