❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️
项目竞品项目
NVIDIA/cccl
CUDA核心计算库
rapidsai/cugraph
cuGraph - RAPIDS 图分析库
NVIDIA/cub
[已归档] CUDA C++协同原语 参见https://github.com/NVIDIA/cccl
masonr/yet-another-bench-script
YABS - 使用fio、iperf3和Geekbench评估Linux服务器性能的简易bash脚本
phoronix-test-suite/phoronix-test-suite
Phoronix Test Suite 开源、跨平台的自动化测试与基准测试软件。
SemiAnalysisAI/InferenceX
开源持续推理基准测试:Qwen3.5、DeepSeek、GPTOSS - GB200 NVL72对比MI355X、B200、GB300 NVL72、H100,即将支持TPUv6e/v7/Trainium2/3
LesnyRumcajs/grpc_bench
多种gRPC基准测试
dotnet/BenchmarkDotNet
强大的 .NET 性能基准测试库
JuliaGPU/JACC.jl
面向高效科学计算的Julia跨平台CPU/GPU数组库,支持parallel_for/parallel_reduce并行操作。
NVIDIA/warp
一个用于加速仿真、数据生成和空间计算的 Python 框架。
flashinfer-ai/flashinfer
FlashInfer:大语言模型服务的核心计算库
NVIDIA/nccl
面向集体多GPU通信的优化原语
NVIDIA/gpu-operator
NVIDIA GPU Operator可在Kubernetes中创建、配置和管理GPU
JuliaGPU/AcceleratedKernels.jl
面向Julia CPU与GPU后端的跨架构并行算法。
ScalingIntelligence/KernelBench
KernelBench:大语言模型能否编写GPU内核?——支持Torch转CUDA的基准测试与工具集
NVIDIA/CUDALibrarySamples
CUDA库示例集
rapidsai/raft
RAFT包含用于机器学习和信息检索的基础性广泛使用算法与原语。
NVIDIA/cuopt
GPU加速决策优化
brucefan1983/GPUMD
图形处理器分子动力学
rapidsai/cuvs
cuVS - GPU向量搜索与聚类计算库
相关项目推荐
karpathy/llm.c
基于纯C/CUDA的简易大语言模型训练
NVlabs/instant-ngp
即时神经图形原语:极速神经辐射场(NeRF)及其他技术
deepseek-ai/FlashMLA
FlashMLA: Efficient MLA decoding kernels
HigherOrderCO/HVM
基于Rust的大规模并行最优函数运行时
deepseek-ai/DeepEP
DeepEP:高效的专家并行通信库
deepseek-ai/DeepGEMM
DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核