❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

reinforcement-learning

话题找到数量

unslothai/unsloth

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

65k
5.8k
469
+6.1k
排名 #19
5月24日
查看详情

d2l-ai/d2l-en

一本包含多框架代码、数学原理与深度讨论的交互式深度学习书籍,已被斯坦福、麻省理工、哈佛和剑桥等全球70个国家500所高校采用。

28k
5k
246
+14
排名 #9
4月19日
查看详情

sgl-project/sglang

SGLang是面向大语言模型与视觉语言模型的高速推理框架。

27k
5.8k
566
+509
排名 #13
5月9日
查看详情

AI4Finance-Foundation/FinGPT

FinGPT:开源金融大语言模型!我们发布革命性🔥训练模型于HuggingFace平台

20k
2.9k
335
+973
排名 #18
5月18日
查看详情

Unity-Technologies/ml-agents

Unity机器学习代理工具包(ML-Agents)是一个开源项目,能让游戏和模拟场景成为训练智能代理的环境,支持深度强化学习与模仿学习。

19k
4.5k
341
+31
排名 #20
5月13日
查看详情

rohitg00/ai-engineering-from-scratch

学习它。构建它。为他人交付它。

18k
3.1k
117
+6.9k
排名 #9
5月25日
查看详情

microsoft/AirSim

基于Unreal Engine/Unity构建的开源自动驾驶模拟器,由微软人工智能与研究部门开发

18k
4.9k
371
+3
排名 #19
3月20日
查看详情

microsoft/agent-lightning

点亮AI智能体的终极训练器

16k
1.5k
425
+1.5k
排名 #13
4月13日
查看详情

AI4Finance-Foundation/FinRL

FinRL®:金融强化学习框架。🔥

15k
3.3k
367
+608
排名 #18
5月25日
查看详情

bulletphysics/bullet3

Bullet Physics SDK:面向 VR、游戏、视觉效果、机器人、机器学习等领域的实时碰撞检测与多物理场模拟

14k
3.1k
361
+5
排名 #18
4月2日
查看详情

datawhalechina/easy-rl

强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/

14k
2.3k
317
+14
排名 #18
5月20日
查看详情

carla-simulator/carla

开源自动驾驶研究模拟器

13k
4.6k
384
+37
排名 #21
5月23日
查看详情

simular-ai/Agent-S

Agent S:仿人类操作计算机的开放式智能体框架

11k
1.3k
282
+43
排名 #12
5月17日
查看详情

aws/amazon-sagemaker-examples

示例 📓 Jupyter 笔记本,展示如何使用 🧠 Amazon SageMaker 构建、训练和部署机器学习模型。

10k
7k
371
+1
排名 #6
3月22日
查看详情

OpenPipe/ART

智能体强化训练器:使用GRPO为现实任务训练多步智能体。为智能体提供在职培训。支持Qwen2.5、Qwen3、Llama等模型的强化学习

9.8k
867
311
+85
排名 #15
5月23日
查看详情

MITDeepLearning/introtodeeplearning

麻省理工学院6.S191课程实验材料:深度学习导论

8.6k
4.5k
337
+32
排名 #16
4月12日
查看详情

NVlabs/Sana

SANA:基于线性扩散 Transformer 的高效高分辨率图像合成

7.5k
568
133
+1.5k
排名 #15
5月24日
查看详情

tailcallhq/forgecode

面向Claude、GPT、O系列、Grok、Deepseek、Gemini及300多种模型的AI增强型结对编程工具

7.1k
1.4k
195
+1.9k
排名 #6
4月30日
查看详情

antinomyhq/forgecode

支持Claude、GPT、O系列、Grok、Deepseek、Gemini及300多种模型的AI配对编程助手

6.4k
1.3k
256
+663
排名 #15
4月9日
查看详情

PufferAI/PufferLib

简化复杂游戏环境中的强化学习实现

5.6k
441
259
+121
排名 #19
4月21日
查看详情

google-deepmind/open_spiel

OpenSpiel是一个用于通用强化学习及游戏搜索与规划研究的游戏环境与算法集合。

5.1k
1.1k
334
+2
排名 #16
3月20日
查看详情

antinomyhq/forge

面向Claude、GPT、O系列、Grok、Deepseek、Gemini及300多种模型的AI增强型结对编程工具

4.9k
1.2k
313
+240
排名 #17
3月15日
查看详情

huggingface/deep-rl-class

该仓库包含Hugging Face的深度强化学习课程。

4.9k
790
326
+19
排名 #19
5月18日
查看详情

inclusionAI/AReaL

专为大型语言模型推理与智能体打造的闪电式强化学习框架。

4.6k
378
309
+969
排名 #9
3月8日
查看详情
助手