项目竞品项目
jump-dev/JuMP.jl
数学优化建模语言(涵盖线性、混合整数、锥规划、半定规划及非线性问题)
MrNeRF/LichtFeld-Studio
LichtFeld工作室:现实与数字世界的交融之处
google/or-tools
Google的运筹学工具:
zeux/meshoptimizer
网格优化库:缩小网格体积并提升渲染速度
rapidsai/cugraph
cuGraph - RAPIDS 图分析库
NVIDIA/cub
[已归档] CUDA C++协同原语 参见https://github.com/NVIDIA/cccl
NVIDIA/nvbench
CUDA内核基准测试库
brucefan1983/GPUMD
图形处理器分子动力学
rapidsai/cuvs
cuVS - GPU向量搜索与聚类计算库
NVIDIA/warp
一个用于加速仿真、数据生成和空间计算的 Python 框架。
flashinfer-ai/flashinfer
FlashInfer:大语言模型服务的核心计算库
NVIDIA/nccl
面向集体多GPU通信的优化原语
diku-dk/futhark
💥💻💥 一种数据并行的函数式编程语言
NVIDIA/cccl
CUDA核心计算库
tenstorrent/tt-metal
🤘 TT-NN算子库与TT-Metalium底层内核编程模型
JuliaGPU/AcceleratedKernels.jl
面向Julia CPU与GPU后端的跨架构并行算法。
isl-org/Open3D
Open3D:面向三维数据处理的现代算法库
rapidsai/cudf
cuDF - GPU 数据帧库
NVIDIA/cutlass
线性代数子程序的CUDA模板
JuliaGPU/cuTile.jl
Julia中的CUDA瓦片编程
相关项目推荐
karpathy/llm.c
基于纯C/CUDA的简易大语言模型训练
NVlabs/instant-ngp
即时神经图形原语:极速神经辐射场(NeRF)及其他技术
deepseek-ai/FlashMLA
FlashMLA: Efficient MLA decoding kernels
HigherOrderCO/HVM
基于Rust的大规模并行最优函数运行时
deepseek-ai/DeepEP
DeepEP:高效的专家并行通信库
deepseek-ai/DeepGEMM
DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核