mlsys

话题找到数量

inclusionAI/AReaL

专为大型语言模型推理与智能体打造的闪电式强化学习框架。

4.6k
378
136
+969
排名 #9
3月8日
查看详情

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.3k
394
187
+149
排名 #15
4月11日
查看详情

thu-ml/SpargeAttn

SpargeAttention:一种免训练的稀疏注意力机制,可加速任何模型推理

951
87
218
+4
排名 #16
2月25日
查看详情
助手