项目介绍
slime 是一个面向强化学习规模化的大语言模型后训练框架。
slime is an LLM post-training framework for RL Scaling.
智能解读
智能标签
使用场景
项目健康度
距上次更新 55 天
平台 Star TOP 40% · Forks 541
本周 +148 ⭐ · 本月 +634 ⭐
109 位贡献者 · 0 条平台评论
缺少 3 项内容
项目信息
赞赏支持
如果本站对你有帮助,欢迎打赏支持
微信
支付宝
Widget 徽章
相关项目推荐
public-apis/public-apis
免费API资源汇总列表
EbookFoundation/free-programming-books
📚 免费提供的编程书籍
donnemartin/system-design-primer
学习如何设计大规模系统。为系统设计面试做准备。包含Anki记忆卡片。
vinta/awesome-python
精心整理的优质Python框架、库、软件及资源列表
TheAlgorithms/Python
所有算法均使用Python实现
Significant-Gravitas/AutoGPT
AutoGPT致力于实现人人可用的普惠AI,让每个人都能使用和构建AI。我们的使命是提供工具,让您专注于重要事务。
加载评论中...