inference

话题找到数量

nomic-ai/gpt4all

GPT4All:在任何设备上运行本地大语言模型。开源且可商用。

77k
8.3k
154
+92
排名 #13
4月7日
查看详情

vllm-project/vllm

面向大语言模型的高吞吐量与内存优化型推理服务引擎

71k
13k
269
+182
排名 #11
3月4日
查看详情

ggml-org/whisper.cpp

OpenAI Whisper模型的C/C++移植版本

48k
5.4k
459
+1k
排名 #20
4月5日
查看详情

colinhacks/zod

采用静态类型推断的TypeScript优先模式验证

41k
1.8k
171
+18
排名 #5
1月25日
查看详情

google-ai-edge/mediapipe

面向直播与流媒体的跨平台可定制机器学习解决方案

34k
5.9k
265
+907
排名 #21
4月9日
查看详情

gitleaks/gitleaks

使用Gitleaks 🔑 发现密钥 (注:根据技术文档惯例,"secrets"在此语境中指代密钥、凭证等敏感信息,采用"密钥"译法符合行业标准;保留工具名称"Gitleaks"不译;添加"使用"二字使中文表达更完整自然;表情符号位置根据中文阅读习惯调整)

25k
1.9k
224
+119
排名 #19
3月6日
查看详情

sgl-project/sglang

SGLang是面向大语言模型与视觉语言模型的高速推理框架。

23k
4.3k
279
+128
排名 #9
2月6日
查看详情

Tencent/ncnn

ncnn专为移动平台优化的高性能神经网络推理框架

23k
4.4k
191
+58
排名 #21
4月5日
查看详情

NVIDIA/TensorRT

NVIDIA® TensorRT™是用于NVIDIA GPU高性能深度学习推理的SDK,本仓库包含其开源组件

12k
2.3k
154
+7
排名 #24
3月26日
查看详情

aws/amazon-sagemaker-examples

示例 📓 Jupyter 笔记本,展示如何使用 🧠 Amazon SageMaker 构建、训练和部署机器学习模型。

10k
7k
173
+1
排名 #6
3月22日
查看详情

mistralai/mistral-inference

Mistral模型官方推理库

10k
1k
118
排名 #15
2月16日
查看详情

RunanywhereAI/runanywhere-sdks

可在本地运行AI的生产就绪工具包

10k
333
200
+5.6k
排名 #17
3月22日
查看详情

openvinotoolkit/openvino

OpenVINO™是用于优化和部署AI推理的开源工具套件

10k
3.2k
256
+207
排名 #22
4月9日
查看详情

oumi-ai/oumi

轻松微调、评估和部署gpt-oss、Qwen3、DeepSeek-R1或任何开源LLM/VLM!

9.1k
738
104
+29
排名 #14
4月3日
查看详情

LMCache/LMCache

通过最快的KV缓存层为您的LLM加速

7.8k
1.1k
163
+632
排名 #12
4月1日
查看详情

RunanywhereAI/runanywhere-sdks

可在本地运行AI的生产就绪工具包

6.6k
205
200
+1.8k
排名 #16
2月8日
查看详情

katanemo/plano

智能体应用交付基础设施——Plano是面向AI原生的代理与数据平面,可卸载底层管道工作,让您专注于智能体核心逻辑开发(支持任意AI框架)。

6.2k
382
201
+685
排名 #15
4月7日
查看详情

argmaxinc/WhisperKit

适用于Apple Silicon设备的本地语音识别

6k
541
189
+202
排名 #21
4月8日
查看详情

kserve/kserve

面向 Kubernetes 可扩展多框架部署的标准化分布式生成式与预测式 AI 推理平台

5.3k
1.4k
126
+8
排名 #16
4月8日
查看详情

kvcache-ai/Mooncake

Mooncake是Moonshot AI旗下领先大语言模型服务Kimi的部署平台。

5k
651
211
+14
排名 #21
4月3日
查看详情

flashinfer-ai/flashinfer

FlashInfer:大语言模型服务的核心计算库

4.8k
670
245
+14
排名 #7
1月27日
查看详情

cactus-compute/cactus

在手机、可穿戴设备及AI原生硬件上本地运行人工智能

4.5k
332
174
+225
排名 #13
3月15日
查看详情

cactus-compute/cactus

在手机、可穿戴设备及AI原生硬件上本地运行人工智能

4.2k
293
174
+68
排名 #15
2月8日
查看详情

vllm-project/vllm-omni

一个面向全模态模型的高效推理框架。

4k
647
181
+530
排名 #15
3月29日
查看详情
助手