grpo - 主题项目

追踪 GitHub 趋势，把握技术发展脉搏

探索趋势了解更多

grpo - 主题项目

追踪 GitHub 趋势，把握技术发展脉搏

探索趋势了解更多

成就解锁

❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

grpo

话题找到数量

modelscope/ms-swift

使用PEFT或全参数方法对500余个大语言模型和200余个多模态大语言模型进行CPT/SFT/DPO/GRPO训练

deepseek-r1 embedding grpo

modelscope

modelscope 开发者

14k

1.5k

574

+26

排名 #12

6月12日

OpenPipe/ART

智能体强化训练器：使用GRPO为现实任务训练多步智能体。为智能体提供在职培训。支持Qwen2.5、Qwen3、Llama等模型的强化学习

agent agentic-ai grpo

OpenPipe

OpenPipe 开发者

9.8k

867

447

+85

排名 #15

5月23日

adongwanai/AgentGuide

https://adongwanai.github.io/AgentGuide | AI智能体开发指南 | LangGraph实战 | 高级RAG | 转型大模型 | 大模型面试 | 算法工程师 | 面试题库 | 强化学习 | 数据合成

agenticrag ai-agent crewai

adongwanai

adongwanai 开发者

7k

692

477

+1.3k

排名 #16

7月14日

Orchestra-Research/AI-Research-SKILLs

面向任意AI模型的综合性开源人工智能研究与工程技能库。

ai ai-research claude

Orchestra-Research

Orchestra-Research 开发者

6.2k

485

393

+1.8k

排名 #11

4月5日

首页上一页

1

1

下一页末页

助手