项目竞品
共找到 20 个竞品NVIDIA/cub
[已归档] CUDA C++协同原语 参见https://github.com/NVIDIA/cccl
NVIDIA/cccl
CUDA核心计算库
NVIDIA/cuopt
GPU加速决策优化
rapidsai/cuvs
cuVS - GPU向量搜索与聚类计算库
NVlabs/instant-ngp
即时神经图形原语:极速神经辐射场(NeRF)及其他技术
NVIDIA/cutlass
线性代数子程序的CUDA模板
flashinfer-ai/flashinfer
FlashInfer:大语言模型服务的核心计算库
thu-ml/SageAttention
量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。
BBuf/how-to-optim-algorithm-in-cuda
如何在CUDA中优化某些算法
isl-org/Open3D
Open3D:面向三维数据处理的现代算法库
seerge/g-helper
华硕笔记本及ROG Ally的轻量化Armoury Crate替代方案。支持ROG Zephyrus G14、G15、G16、M16、Flow X13、Flow X16、TUF、Strix、Scar等型号的控制工具。
dotnet/BenchmarkDotNet
强大的 .NET 性能基准测试库
rapidsai/cudf
cuDF - GPU 数据帧库
NVIDIA/cuda-samples
面向CUDA开发者的示例代码库,展示CUDA工具包功能特性
masonr/yet-another-bench-script
YABS - 使用fio、iperf3和Geekbench评估Linux服务器性能的简易bash脚本
ilya-zlobintsev/LACT
Linux 显卡配置与监控工具
phoronix-test-suite/phoronix-test-suite
Phoronix Test Suite 开源、跨平台的自动化测试与基准测试软件。
diku-dk/futhark
💥💻💥 一种数据并行的函数式编程语言
tenstorrent/tt-metal
🤘 TT-NN算子库与TT-Metalium底层内核编程模型
gin-gonic/gin
Gin 是一个用 Go (Golang) 编写的 HTTP Web 框架。它提供了类似 Martini 的 API,但性能更优——速度提升高达 40 倍。如果您需要出色的性能,请使用 Gin。
相关项目推荐
karpathy/llm.c
基于纯C/CUDA的简易大语言模型训练
NVlabs/instant-ngp
即时神经图形原语:极速神经辐射场(NeRF)及其他技术
deepseek-ai/FlashMLA
FlashMLA: Efficient MLA decoding kernels
HigherOrderCO/HVM
基于Rust的大规模并行最优函数运行时
deepseek-ai/DeepEP
DeepEP:高效的专家并行通信库
deepseek-ai/DeepGEMM
DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核