model-serving

话题找到数量

vllm-project/vllm

面向大语言模型的高吞吐量与内存优化型推理服务引擎

71k
13k
277
+182
排名 #11
3月4日
查看详情

kserve/kserve

面向 Kubernetes 可扩展多框架部署的标准化分布式生成式与预测式 AI 推理平台

5.3k
1.4k
126
+8
排名 #16
4月8日
查看详情

beclab/Olares

Olares:一个开源的私有云平台,助您重掌数据主权。

4.1k
217
108
+6
排名 #4
2月26日
查看详情

vllm-project/vllm-omni

一个面向全模态模型的高效推理框架。

4k
647
214
+530
排名 #15
3月29日
查看详情

vllm-project/vllm-ascend

面向昇腾平台的vLLM社区维护硬件插件

1.8k
962
272
+31
排名 #7
3月22日
查看详情

vllm-project/vllm-ascend

面向昇腾平台的vLLM社区维护硬件插件

1.8k
962
272
+25
排名 #20
3月20日
查看详情

alibaba/rtp-llm

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1.1k
167
231
+61
排名 #14
4月9日
查看详情
助手