❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

inference

话题找到数量

cactus-compute/cactus

在手机、可穿戴设备及AI原生硬件上本地运行人工智能

5.2k
413
332
+292
排名 #13
5月24日
查看详情

flashinfer-ai/flashinfer

FlashInfer:大语言模型服务的核心计算库

4.8k
670
419
+14
排名 #7
1月27日
查看详情

cactus-compute/cactus

在手机、可穿戴设备及AI原生硬件上本地运行人工智能

4.2k
293
332
+68
排名 #15
2月8日
查看详情

lemonade-sdk/lemonade

Lemonade 通过直接在用户自己的 GPU 和 NPU 上运行优化后的 LLM,帮助用户发现并运行本地 AI 应用。加入我们的 Discord:https://discord.gg/5xXzkMu8Zk

4.1k
316
141
+1.1k
排名 #15
5月24日
查看详情

ruvnet/ruvector

RuVector是一款用Rust构建的高性能向量与图数据库,专为人工智能、智能体系统和实时分析设计。它将HNSW搜索、动态最小割一致性、图智能与自学习记忆融合为统一引擎,实现可扩展、低延迟的推理与结构化检索。

4k
500
465
+1.8k
排名 #15
5月10日
查看详情

NVIDIA/GenerativeAIExamples

面向加速基础设施与微服务架构优化的生成式AI参考工作流

4k
1.1k
362
+30
排名 #17
5月13日
查看详情

vllm-project/vllm-omni

一个面向全模态模型的高效推理框架。

4k
647
360
+530
排名 #15
3月29日
查看详情

zml/zml

任意模型·任意硬件·零妥协·基于@ziglang/@openxla/MLIR/@bazelbuild构建

3.5k
143
236
+170
排名 #16
5月20日
查看详情

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.4k
422
351
+149
排名 #15
5月24日
查看详情

hao-ai-lab/FastVideo

面向加速视频生成的统一推理与训练后处理框架

3.3k
298
337
+23
排名 #15
3月23日
查看详情

llm-d/llm-d

llm-d 是基于 Kubernetes 的高性能分布式 LLM 推理框架

3.2k
493
183
+5
排名 #9
5月23日
查看详情

pgmpy/pgmpy

用于因果人工智能的Python库

3.2k
1k
268
+7
排名 #5
3月7日
查看详情

openvinotoolkit/openvino_notebooks

📚 OpenVINO™ 的 Jupyter Notebook 教程

3.1k
1k
345
+6
排名 #14
5月10日
查看详情

google/XNNPACK

面向移动设备、服务器和Web的高效浮点神经网络推理算子

2.3k
472
279
+3
排名 #11
3月28日
查看详情

vllm-project/vllm-ascend

面向昇腾平台的vLLM社区维护硬件插件

2.1k
1.3k
523
+25
排名 #20
5月22日
查看详情

vllm-project/vllm-ascend

面向昇腾平台的vLLM社区维护硬件插件

2.1k
1.2k
523
+31
排名 #11
5月10日
查看详情

raullenchai/Rapid-MLX

专为Apple Silicon打造的最快本地AI引擎。比Ollama快4.2倍,缓存TTFT仅0.08秒,100%工具调用。支持17种工具解析器、提示缓存、推理分离与云路由。可直接替代OpenAI,兼容Claude Code、Cursor、Aider。

1.7k
229
142
+491
排名 #17
5月6日
查看详情

envoyproxy/ai-gateway

基于Envoy Gateway构建的生成式AI服务统一访问管理平台

1.7k
257
185
+63
排名 #18
5月24日
查看详情

RightNow-AI/picolm

在仅256MB内存、10美元成本的开发板上运行10亿参数大语言模型

1.6k
190
117
+3
排名 #12
4月27日
查看详情

jd-opensource/xllm

专为多种AI加速器优化的大语言模型高性能推理引擎。

1.2k
178
374
+46
排名 #23
4月12日
查看详情

alibaba/rtp-llm

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1.1k
193
391
+61
排名 #14
5月24日
查看详情

Andyyyy64/whichllm

找到真正能在你的硬件上运行且性能最佳的本地大语言模型。基于真实且考虑时效性的基准进行排名,而非参数数量。一条命令,即刻运行。

1k
42
77
+209
排名 #7
5月17日
查看详情

thu-ml/SpargeAttn

SpargeAttention:一种免训练的稀疏注意力机制,可加速任何模型推理

951
87
346
+4
排名 #16
2月25日
查看详情

carverauto/serviceradar

开源网络管理与可观测性平台

812
57
305
+76
排名 #3
2月18日
查看详情
助手