2026-02-09
🏷️

#inference 每日趋势报告

📅 2026-02-09
📊 5 个项目

🔥 #inference 每日热门项目

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.2k
338
69
+8
排名 #8
2月9日
查看详情

argmaxinc/WhisperKit

适用于Apple Silicon设备的本地语音识别

5.6k
501
68
+5
排名 #16
2月9日
查看详情

zml/zml

任意模型·任意硬件·零妥协·基于@ziglang/@openxla/MLIR/@bazelbuild构建

3.1k
117
51
+5
排名 #13
2月9日
查看详情

thu-ml/SpargeAttn

SpargeAttention:一种免训练的稀疏注意力机制,可加速任何模型推理

932
84
88
+4
排名 #10
2月9日
查看详情

alibaba/rtp-llm

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1k
153
73
+3
排名 #7
2月9日
查看详情

📊 数据统计

5 个热门项目
2026-02-09 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手