请选择一个日期
🏷️

#inference 每日趋势报告

📅 2026-02-27
📊 9 个项目

🔥 #inference 每日热门项目

ruvnet/ruvector

RuVector是一款用Rust构建的高性能向量与图数据库,专为人工智能、智能体系统和实时分析设计。它将HNSW搜索、动态最小割一致性、图智能与自学习记忆融合为统一引擎,实现可扩展、低延迟的推理与结构化检索。

1.9k
197
264
+410
排名 #11
2月27日
查看详情

ruvnet/ruvector

RuVector是一款用Rust构建的高性能向量与图数据库,专为人工智能、智能体系统和实时分析设计。它将HNSW搜索、动态最小割一致性、图智能与自学习记忆融合为统一引擎,实现可扩展、低延迟的推理与结构化检索。

1.9k
197
264
+410
排名 #1
2月27日
查看详情

katanemo/plano

智能体应用交付基础设施——Plano是面向AI原生的代理与数据平面,可卸载底层管道工作,让您专注于智能体核心逻辑开发(支持任意AI框架)。

5.8k
342
226
+35
排名 #9
2月27日
查看详情

vllm-project/vllm-ascend

面向昇腾平台的vLLM社区维护硬件插件

1.7k
856
288
+9
排名 #10
2月27日
查看详情

NVIDIA/TensorRT

NVIDIA® TensorRT™是用于NVIDIA GPU高性能深度学习推理的SDK,本仓库包含其开源组件

12k
2.3k
202
+7
排名 #24
2月27日
查看详情

Tencent/ncnn

ncnn专为移动平台优化的高性能神经网络推理框架

22k
4.4k
258
+5
排名 #21
2月27日
查看详情

zml/zml

任意模型·任意硬件·零妥协·基于@ziglang/@openxla/MLIR/@bazelbuild构建

3.2k
119
158
+2
排名 #7
2月27日
查看详情

alibaba/rtp-llm

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1.1k
154
235
+2
排名 #5
2月27日
查看详情

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.2k
359
187
+1
排名 #1
2月27日
查看详情

📊 数据统计

9 个热门项目
2026-02-27 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手