rocm

话题找到数量

tracel-ai/burn

Burn是下一代深度学习框架,在灵活性、效率和可移植性方面毫不妥协。

14k
825
301
+113
排名 #11
2月21日
查看详情

LMCache/LMCache

通过最快的KV缓存层为您的LLM加速

7.8k
1.1k
169
+632
排名 #12
4月1日
查看详情

SemiAnalysisAI/InferenceX

开源持续推理基准测试:Qwen3.5、DeepSeek、GPTOSS - GB200 NVL72对比MI355X、B200、GB300 NVL72、H100,即将支持TPUv6e/v7/Trainium2/3

500
86
185
+6
排名 #6
2月18日
查看详情

JuliaGPU/AcceleratedKernels.jl

面向Julia CPU与GPU后端的跨架构并行算法。

188
11
126
+2
排名 #2
3月15日
查看详情
助手