rl
共找到 97 个相关项目
datawhalechina/easy-rl
强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/
leachim6/hello-world
用各种计算机语言编写的Hello World程序。感谢各位贡献者,请务必查阅contributing.md文件了解贡献指南!
WasmEdge/WasmEdge
WasmEdge 是一个轻量级、高性能且可扩展的 WebAssembly 运行时,适用于云原生、边缘和去中心化应用。它为无服务器应用、嵌入式函数、微服务、智能合约和物联网设备提供支持。
kedacore/keda
KEDA是基于Kubernetes的事件驱动自动伸缩组件,可为Kubernetes中运行的任何容器提供事件驱动的扩缩容能力
OpenPipe/ART
智能体强化训练器:使用GRPO为现实任务训练多步智能体。为智能体提供在职培训。支持Qwen2.5、Qwen3、Llama等模型的强化学习
HariSekhon/DevOps-Bash-tools
1000多个DevOps Bash脚本 - 涵盖AWS、GCP、Kubernetes、Docker、CI/CD、API、SQL、PostgreSQL、MySQL、Hive、Impala、Kafka、Hadoop、Jenkins、GitHub、GitLab、BitBucket、Azure DevOps、TeamCity、Spotify、MP3、LDAP、代码/构建检查,支持Linux、Mac、Python、Perl、Ruby、NodeJS、Golang的包管理,高级配置文件:.bashrc、.vimrc、.gitconfig、.screenrc、tmux
duixcom/Duix-Mobile
🚀 全网效果最好的移动端【实时对话数字人】。支持本地部署、多模态交互(语音、文本、表情),响应速度低于 1.5 秒,适用于直播、教学、客服、金融、政务等对隐私与实时性要求极高的场景。开箱即用,开发者友好。