2026-03-15
🏷️

#inference 每周趋势报告

📅 2026-03-15
📊 2 个项目

🔥 #inference 每周热门项目

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.2k
369
182
+20
排名 #3
3月15日
查看详情

alibaba/rtp-llm

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1.1k
159
231
+9
排名 #8
3月15日
查看详情

📊 数据统计

2 个热门项目
2026-03-15 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手