请选择一个日期
🏷️

#inference 每日趋势报告

📅 2026-01-23
📊 6 个项目

🔥 #inference 每日热门项目

vllm-project/vllm

面向大语言模型的高吞吐量与内存优化型推理服务引擎

68k
12k
88
+182
排名 #8
1月23日
查看详情

RunanywhereAI/runanywhere-sdks

可在本地运行AI的生产就绪工具包

4.1k
133
110
+112
排名 #3
1月23日
查看详情

argmaxinc/WhisperKit

适用于Apple Silicon设备的本地语音识别

5.5k
491
115
+19
排名 #8
1月23日
查看详情

zml/zml

任意模型·任意硬件·零妥协·基于@ziglang/@openxla/MLIR/@bazelbuild构建

3.1k
112
71
+2
排名 #6
1月23日
查看详情

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.1k
324
111
+1
排名 #1
1月23日
查看详情

alibaba/rtp-llm

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1k
149
107
+1
排名 #3
1月23日
查看详情

📊 数据统计

6 个热门项目
2026-01-23 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手