inference

共找到 27 个相关项目

nomic-ai/gpt4all

GPT4All:在任何设备上运行本地大语言模型。开源且可商用。

77k
8.3k
48
+92
排名 #13
2月20日
查看详情

vllm-project/vllm

面向大语言模型的高吞吐量与内存优化型推理服务引擎

68k
12k
56
+182
排名 #8
1月23日
查看详情

ggml-org/whisper.cpp

OpenAI Whisper模型的C/C++移植版本

46k
5.2k
99
+1k
排名 #20
2月1日
查看详情

colinhacks/zod

采用静态类型推断的TypeScript优先模式验证

41k
1.8k
59
+18
排名 #5
1月25日
查看详情

google-ai-edge/mediapipe

面向直播与流媒体的跨平台可定制机器学习解决方案

33k
5.8k
87
+907
排名 #2
1月31日
查看详情

gitleaks/gitleaks

使用Gitleaks 🔑 发现密钥 (注:根据技术文档惯例,"secrets"在此语境中指代密钥、凭证等敏感信息,采用"密钥"译法符合行业标准;保留工具名称"Gitleaks"不译;添加"使用"二字使中文表达更完整自然;表情符号位置根据中文阅读习惯调整)

25k
1.9k
78
+119
排名 #19
2月22日
查看详情

sgl-project/sglang

SGLang是面向大语言模型与视觉语言模型的高速推理框架。

23k
4.3k
121
+128
排名 #9
2月6日
查看详情

NVIDIA/TensorRT

NVIDIA® TensorRT™是用于NVIDIA GPU高性能深度学习推理的SDK,本仓库包含其开源组件

12k
2.3k
53
+6
排名 #9
1月30日
查看详情

mistralai/mistral-inference

Mistral模型官方推理库

10k
1k
23
排名 #15
2月16日
查看详情

openvinotoolkit/openvino

OpenVINO™是用于优化和部署AI推理的开源工具套件

9.7k
3.1k
74
+207
排名 #22
2月20日
查看详情

RunanywhereAI/runanywhere-sdks

可在本地运行AI的生产就绪工具包

9.4k
271
72
+1.5k
排名 #17
2月22日
查看详情

RunanywhereAI/runanywhere-sdks

可在本地运行AI的生产就绪工具包

6.6k
205
72
+1.8k
排名 #16
2月8日
查看详情

argmaxinc/WhisperKit

适用于Apple Silicon设备的本地语音识别

5.7k
506
64
+188
排名 #21
2月23日
查看详情

katanemo/plano

智能体应用交付基础设施——Plano是面向AI原生的代理与数据平面,可卸载底层管道工作,让您专注于智能体核心逻辑开发(支持任意AI框架)。

5.1k
290
75
+63
排名 #15
2月19日
查看详情

flashinfer-ai/flashinfer

FlashInfer:大语言模型服务的核心计算库

4.8k
670
91
+14
排名 #7
1月27日
查看详情

kvcache-ai/Mooncake

Mooncake是Moonshot AI旗下领先大语言模型服务Kimi的部署平台。

4.8k
558
115
+14
排名 #21
2月14日
查看详情

cactus-compute/cactus

在手机、可穿戴设备及AI原生硬件上本地运行人工智能

4.3k
313
76
+10
排名 #1
2月22日
查看详情

cactus-compute/cactus

在手机、可穿戴设备及AI原生硬件上本地运行人工智能

4.2k
293
76
+68
排名 #15
2月8日
查看详情

NVIDIA/GenerativeAIExamples

面向加速基础设施与微服务架构优化的生成式AI参考工作流

3.8k
976
65
+20
排名 #15
2月13日
查看详情

zml/zml

任意模型·任意硬件·零妥协·基于@ziglang/@openxla/MLIR/@bazelbuild构建

3.2k
118
48
+37
排名 #15
2月23日
查看详情

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.2k
355
62
+149
排名 #15
2月23日
查看详情

hao-ai-lab/FastVideo

面向加速视频生成的统一推理与训练后处理框架

3.1k
260
87
+9
排名 #6
2月7日
查看详情

openvinotoolkit/openvino_notebooks

📚 OpenVINO™ 的 Jupyter Notebook 教程

3k
973
98
排名 #10
2月2日
查看详情

vllm-project/vllm-ascend

面向昇腾平台的vLLM社区维护硬件插件

1.7k
822
76
+25
排名 #20
2月10日
查看详情
助手