2026-03-18
🏷️

#inference 每日趋势报告

📅 2026-03-18
📊 4 个项目

🔥 #inference 每日热门项目

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.2k
373
182
+3
排名 #3
3月18日
查看详情

zml/zml

任意模型·任意硬件·零妥协·基于@ziglang/@openxla/MLIR/@bazelbuild构建

3.3k
125
158
+2
排名 #7
3月18日
查看详情

alibaba/rtp-llm

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1.1k
162
231
+1
排名 #6
3月18日
查看详情

NVIDIA/GenerativeAIExamples

面向加速基础设施与微服务架构优化的生成式AI参考工作流

3.9k
1k
235
排名 #11
3月18日
查看详情

📊 数据统计

4 个热门项目
2026-03-18 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手