2026-04-14
🏷️

#inference 每日趋势报告

📅 2026-04-14
📊 5 个项目

🔥 #inference 每日热门项目

vllm-project/vllm

面向大语言模型的高吞吐量与内存优化型推理服务引擎

76k
15k
345
+162
排名 #6
4月14日
查看详情

katanemo/plano

智能体应用交付基础设施——Plano是面向AI原生的代理与数据平面,可卸载底层管道工作,让您专注于智能体核心逻辑开发(支持任意AI框架)。

6.3k
399
254
+18
排名 #6
4月14日
查看详情

zml/zml

任意模型·任意硬件·零妥协·基于@ziglang/@openxla/MLIR/@bazelbuild构建

3.4k
133
164
+10
排名 #2
4月14日
查看详情

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.3k
398
236
+3
排名 #11
4月14日
查看详情

alibaba/rtp-llm

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1.1k
169
286
+1
排名 #9
4月14日
查看详情

📊 数据统计

5 个热门项目
2026-04-14 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手