2026-01-27
🏷️

#inference 每日趋势报告

📅 2026-01-27
📊 4 个项目

🔥 #inference 每日热门项目

flashinfer-ai/flashinfer

FlashInfer:大语言模型服务的核心计算库

4.8k
670
134
+14
排名 #7
1月27日
查看详情

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.1k
326
111
+2
排名 #10
1月27日
查看详情

alibaba/rtp-llm

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1k
152
111
排名 #8
1月27日
查看详情

thu-ml/SpargeAttn

SpargeAttention:一种免训练的稀疏注意力机制,可加速任何模型推理

917
82
108
排名 #16
1月27日
查看详情

📊 数据统计

4 个热门项目
2026-01-27 数据日期

🔥 TrendForge - 追踪开源项目热度,发现技术趋势

助手