inference

argmaxinc/WhisperKit

Swift

适用于Apple Silicon设备的本地语音识别

inference ios macos

argmaxinc 开发者

6k

541

540

+202

排名 #21

4月8日

查看详情

vimeo/psalm

PHP

一款用于发现PHP应用程序错误与安全漏洞的静态分析工具

hacktoberfest php security-analysis

vimeo 开发者

5.9k

698

365

+1

排名 #16

6月15日

查看详情

kvcache-ai/Mooncake

C++

Mooncake是Moonshot AI旗下领先大语言模型服务Kimi的部署平台。

disaggregation inference kvcache

kvcache-ai 开发者

5.7k

909

549

+233

排名 #21

6月30日

查看详情

kserve/kserve

Go

面向 Kubernetes 可扩展多框架部署的标准化分布式生成式与预测式 AI 推理平台

artificial-intelligence cncf genai

kserve 开发者

5.7k

1.6k

524

+8

排名 #19

7月14日

查看详情

Michael-A-Kuykendall/shimmy

Rust

⚡ 无需Python的Rust推理服务器 — 兼容OpenAI-API。支持GGUF与SafeTensors、热模型切换、自动发现、单二进制文件。现在免费，永远免费。

api-server command-line-tool developer-tools

Michael-A-Kuykendall 开发者

5.6k

533

304

+444

排名 #17

6月29日

查看详情

cactus-compute/cactus

C++

在手机、可穿戴设备及AI原生硬件上本地运行人工智能

ai android edge

cactus-compute 开发者

5.5k

442

518

+68

排名 #15

7月14日

查看详情

Andyyyy64/whichllm

Python

找到真正能在你的硬件上运行且性能最佳的本地大语言模型。基于真实且考虑时效性的基准进行排名，而非参数数量。一条命令，即刻运行。

ai apple-silicon benchmarks

Andyyyy64 开发者

5.5k

289

226

+3.2k

排名 #12

6月30日

查看详情

cactus-compute/cactus

C

在手机、可穿戴设备及AI原生硬件上本地运行人工智能

ai android edge

cactus-compute 开发者

5.3k

418

518

+579

排名 #13

5月31日

查看详情

vllm-project/vllm-omni

Python

一个面向全模态模型的高效推理框架。

audio-generation diffusion image-generation

vllm-project 开发者

5.1k

1.1k

541

+530

排名 #15

6月10日

查看详情

lemonade-sdk/lemonade

C++

Lemonade 通过直接在用户自己的 GPU 和 NPU 上运行优化后的 LLM，帮助用户发现并运行本地 AI 应用。加入我们的 Discord：https://discord.gg/5xXzkMu8Zk

ai amd genai

lemonade-sdk 开发者

4.8k

387

319

+1.1k

排名 #23

7月7日

查看详情

flashinfer-ai/flashinfer

Python

FlashInfer：大语言模型服务的核心计算库

attention cuda distributed-inference

flashinfer-ai 开发者

4.8k

670

644

+14

排名 #7

1月27日

查看详情

OpenNMT/CTranslate2

C++

面向Transformer模型的快速推理引擎

avx avx2 cpp

OpenNMT 开发者

4.5k

497

175

+3

排名 #20

6月27日

查看详情

ruvnet/ruvector

Rust

RuVector是一款用Rust构建的高性能向量与图数据库，专为人工智能、智能体系统和实时分析设计。它将HNSW搜索、动态最小割一致性、图智能与自学习记忆融合为统一引擎，实现可扩展、低延迟的推理与结构化检索。

ai ai-ocr attention-mechanism

ruvnet 开发者

4.3k

569

609

+1.8k

排名 #15

7月8日

查看详情

OpenCSGs/csghub

Vue

CSGHub是由OpenCSG团队开发的全新开源大语言模型管理平台，提供开源版和本地化/SaaS解决方案，功能对标Hugging Face。完整掌控大语言模型、数据集和智能体的生命周期，Python SDK与Hugging Face兼容。欢迎加入我们！⭐️

ai asset-management dataset

OpenCSGs 开发者

4.2k

519

283

+1

排名 #15

6月15日

查看详情

NVIDIA/GenerativeAIExamples

Jupyter Notebook

面向加速基础设施与微服务架构优化的生成式AI参考工作流

gpu-acceleration large-language-models llm

NVIDIA 开发者

4k

1.1k

585

+30

排名 #17

5月13日

查看详情

zml/zml

Zig

任意模型·任意硬件·零妥协·基于@ziglang/@openxla/MLIR/@bazelbuild构建

ai bazel hpc

zml 开发者

3.9k

169

381

+170

排名 #18

7月13日

查看详情

llm-d/llm-d

Shell

llm-d 是基于 Kubernetes 的高性能分布式 LLM 推理框架

ai cncf distributed-inference

llm-d 开发者

3.7k

581

308

+255

排名 #16

7月5日

查看详情

thu-ml/SageAttention

Cuda

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升，且在语言、图像和视频模型上保持端到端指标无损。

attention cuda efficient-attention

thu-ml 开发者

3.5k

444

500

+149

排名 #16

7月15日

查看详情

hao-ai-lab/FastVideo

Python

面向加速视频生成的统一推理与训练后处理框架

diffusers diffusion-models distillation

hao-ai-lab 开发者

3.3k

298

516

+23

排名 #15

3月23日

查看详情

pgmpy/pgmpy

Python

用于因果人工智能的Python库

bayesian-networks causal-discovery causal-effect

pgmpy 开发者

3.2k

1k

444

+7

排名 #5

3月7日

查看详情

openvinotoolkit/openvino_notebooks

Jupyter Notebook

📚 OpenVINO™ 的 Jupyter Notebook 教程

computer-vision deep-learning inference

openvinotoolkit 开发者

3.2k

1k

554

+6

排名 #17

6月22日

查看详情

spiceai/spiceai

Rust

一个用Rust编写的便携式加速SQL查询、搜索及LLM推理引擎，适用于数据驱动的AI应用与智能体。

artificial-intelligence data data-federation

spiceai 开发者

3k

204

202

+4

排名 #19

6月22日

查看详情

vllm-project/vllm-ascend

C++

面向昇腾平台的vLLM社区维护硬件插件

ascend inference llm

vllm-project 开发者

2.5k

1.7k

801

+130

排名 #21

7月12日

查看详情

google/XNNPACK

C

面向移动设备、服务器和Web的高效浮点神经网络推理算子

convolutional-neural-network convolutional-neural-networks cpu

google 开发者

2.4k

526

439

+6

排名 #16

7月15日

查看详情

inference - 主题项目

inference - 主题项目

每日趋势

每周趋势

每月趋势

趋势分析

argmaxinc/WhisperKit

vimeo/psalm

kvcache-ai/Mooncake

kserve/kserve

Michael-A-Kuykendall/shimmy

cactus-compute/cactus

Andyyyy64/whichllm

cactus-compute/cactus

vllm-project/vllm-omni

lemonade-sdk/lemonade

flashinfer-ai/flashinfer

OpenNMT/CTranslate2

ruvnet/ruvector

OpenCSGs/csghub

NVIDIA/GenerativeAIExamples

zml/zml

llm-d/llm-d

thu-ml/SageAttention

hao-ai-lab/FastVideo

pgmpy/pgmpy

openvinotoolkit/openvino_notebooks

spiceai/spiceai

vllm-project/vllm-ascend

google/XNNPACK

TrendForge 助手