项目竞品项目
Project-HAMi/HAMi
异构AI计算虚拟化中间件(CNCF孵化项目)
deepflowio/deepflow
eBPF可观测性——分布式追踪与性能剖析
kubeflow/trainer
基于Kubernetes的分布式AI模型训练与微调
NVIDIA/cutlass
线性代数子程序的CUDA模板
NVIDIA/warp
一个用于加速仿真、数据生成和空间计算的 Python 框架。
flashinfer-ai/flashinfer
FlashInfer:大语言模型服务的核心计算库
NVIDIA/nccl
面向集体多GPU通信的优化原语
NVIDIA/cccl
CUDA核心计算库
rapidsai/cugraph
cuGraph - RAPIDS 图分析库
NVIDIA/cub
[已归档] CUDA C++协同原语 参见https://github.com/NVIDIA/cccl
NVIDIA/nvbench
CUDA内核基准测试库
SemiAnalysisAI/InferenceX
开源持续推理基准测试:Qwen3.5、DeepSeek、GPTOSS - GB200 NVL72对比MI355X、B200、GB300 NVL72、H100,即将支持TPUv6e/v7/Trainium2/3
seerge/g-helper
华硕笔记本及ROG Ally的轻量化Armoury Crate替代方案。支持ROG Zephyrus G14、G15、G16、M16、Flow X13、Flow X16、TUF、Strix、Scar等型号的控制工具。
Syllo/nvtop
适用于AMD、苹果、华为、英特尔、英伟达和高通的GPU与加速器进程监控
ilya-zlobintsev/LACT
Linux 显卡配置与监控工具
isl-org/Open3D
Open3D:面向三维数据处理的现代算法库
rapidsai/cudf
cuDF - GPU 数据帧库
diku-dk/futhark
💥💻💥 一种数据并行的函数式编程语言
tenstorrent/tt-metal
🤘 TT-NN算子库与TT-Metalium底层内核编程模型
NVIDIA/cuopt
GPU加速决策优化
相关项目推荐
ollama/ollama
开始使用OpenAI gpt-oss、DeepSeek-R1、Gemma 3及其他模型。
avelino/awesome-go
一份精选的Go语言优秀框架、库及软件列表
golang/go
Go 编程语言
kubernetes/kubernetes
生产级容器调度与管理平台
fatedier/frp
一款快速反向代理,可帮助您将NAT或防火墙后的本地服务器暴露至互联网。
gin-gonic/gin
Gin 是一个用 Go (Golang) 编写的 HTTP Web 框架。它提供了类似 Martini 的 API,但性能更优——速度提升高达 40 倍。如果您需要出色的性能,请使用 Gin。