项目竞品

共找到 20 个竞品
vllm-project

vllm-project/vllm

68.4k 12.9k

面向大语言模型的高吞吐量与内存优化型推理服务引擎

Python inference
相似度
17%
+182
sgl-project

sgl-project/sglang

23.4k 4.3k

SGLang是面向大语言模型与视觉语言模型的高速推理框架。

Python inference
相似度
17%
+128
Lightricks

Lightricks/LTX-Video

9.3k 876

LTX-Video 官方代码库

Python diffusion-models
相似度
17%
+27
AIDC-AI

AIDC-AI/Pixelle-Video

2.5k 419

🚀 AI 全自动短视频引擎 | AI Fully Automated Short Video Engine

Python video-generation
相似度
17%
+160
HKUDS

HKUDS/ViMax

2.1k 395

ViMax:全能型智能体视频生成系统(集成导演、编剧、制片与视频生成功能)

Python video-generation
相似度
17%
+95
RunanywhereAI

RunanywhereAI/runanywhere-sdks

9.9k 282

可在本地运行AI的生产就绪工具包

Kotlin diffusion-models inference
相似度
33%
+1.8k
openvinotoolkit

openvinotoolkit/openvino

9.7k 3.1k

OpenVINO™是用于优化和部署AI推理的开源工具套件

C++ diffusion-models inference
相似度
33%
+207
ggml-org

ggml-org/whisper.cpp

47.0k 5.2k

OpenAI Whisper模型的C/C++移植版本

C++ inference
相似度
17%
+1.0k
google-ai-edge

google-ai-edge/mediapipe

33.6k 5.8k

面向直播与流媒体的跨平台可定制机器学习解决方案

C++ inference
相似度
17%
+907
NVIDIA

NVIDIA/TensorRT

12.7k 2.3k

NVIDIA® TensorRT™是用于NVIDIA GPU高性能深度学习推理的SDK,本仓库包含其开源组件

C++ inference
相似度
17%
+6
duixcom

duixcom/Duix-Avatar

12.4k 2.0k

🚀 真正开源的 AI 数字人工具包,支持离线视频生成与数字人克隆

C video-generation
相似度
17%
+11
argmaxinc

argmaxinc/WhisperKit

5.7k 506

适用于Apple Silicon设备的本地语音识别

Swift inference
相似度
17%
+188
kvcache-ai

kvcache-ai/Mooncake

4.8k 558

Mooncake是Moonshot AI旗下领先大语言模型服务Kimi的部署平台。

C++ inference
相似度
17%
+14
thu-ml

thu-ml/SageAttention

3.2k 355

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

Cuda video-generation
相似度
17%
+149
zml

zml/zml

3.2k 118

任意模型·任意硬件·零妥协·基于@ziglang/@openxla/MLIR/@bazelbuild构建

Zig inference
相似度
17%
+37
openvinotoolkit

openvinotoolkit/openvino_notebooks

3.0k 973

📚 OpenVINO™ 的 Jupyter Notebook 教程

Jupyter Notebook inference
相似度
17%
vllm-project

vllm-project/vllm-ascend

1.7k 822

面向昇腾平台的vLLM社区维护硬件插件

C++ inference
相似度
17%
+25
jd-opensource

jd-opensource/xllm

1.1k 140

专为多种AI加速器优化的大语言模型高性能推理引擎。

C++ inference
相似度
17%
+9
alibaba

alibaba/rtp-llm

1.0k 154

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

Cuda inference
相似度
17%
+61
thu-ml

thu-ml/SpargeAttn

938 84

SpargeAttention:一种免训练的稀疏注意力机制,可加速任何模型推理

Cuda video-generation
相似度
17%
+4
助手