cuda

面向大语言模型的高吞吐量与内存优化型推理服务引擎

amd blackwell cuda

vllm-project 开发者

80k

17k

575

+182

排名 #11

5月20日

查看详情

nagadomi/waifu2x

Lua

动漫风格图像超分辨率技术

super-resolution torch waifu2x

nagadomi 开发者

28k

2.7k

339

+38

排名 #25

4月24日

查看详情

sgl-project/sglang

SGLang是面向大语言模型与视觉语言模型的高速推理框架。

attention blackwell cuda

sgl-project 开发者

27k

5.8k

558

+509

排名 #13

5月9日

查看详情

jamiepine/voicebox

TypeScript

开源语音合成工作室

ai cuda mlx

jamiepine 开发者

26k

3.2k

229

+5.7k

排名 #12

5月18日

查看详情

hashcat/hashcat

全球最快最先进的密码恢复工具

c cracking cuda

hashcat 开发者

25k

3.4k

329

+17

排名 #17

4月13日

查看详情

NVlabs/instant-ngp

Cuda

即时神经图形原语：极速神经辐射场（NeRF）及其他技术

3d-reconstruction computer-graphics computer-vision

NVlabs 开发者

17k

2.1k

381

+92

排名 #15

5月24日

查看详情

tracel-ai/burn

Rust

Burn是下一代深度学习框架，在灵活性、效率和可移植性方面毫不妥协。

autodiff cross-platform cuda

tracel-ai 开发者

15k

900

506

+113

排名 #12

5月10日

查看详情

isl-org/Open3D

Open3D：面向三维数据处理的现代算法库

3d 3d-perception arm

isl-org 开发者

13k

2.5k

439

+34

排名 #17

4月1日

查看详情

taskflow/taskflow

基于现代C++的通用任务并行编程系统

concurrent-programming cuda-programming gpu-programming

taskflow 开发者

11k

1.4k

239

排名 #12

4月2日

查看详情

NVIDIA/cutlass

线性代数子程序的CUDA模板

cpp cuda deep-learning

9.8k

1.9k

466

+198

排名 #24

5月22日

查看详情

rapidsai/cudf

cuDF - GPU 数据帧库

arrow cpp cuda

rapidsai 开发者

9.6k

491

+28

排名 #14

3月19日

查看详情

replicate/cog

机器学习容器

ai containers cuda

replicate 开发者

9.4k

683

219

+17

排名 #1

4月3日

查看详情

NVIDIA/cuda-samples

面向CUDA开发者的示例代码库，展示CUDA工具包功能特性

cuda cuda-driver-api cuda-kernels

9.2k

2.3k

283

+35

排名 #21

5月17日

查看详情

NVIDIA/cuda-samples

面向CUDA开发者的示例代码库，展示CUDA工具包功能特性

cuda cuda-driver-api cuda-kernels

2.3k

283

排名 #15

3月31日

查看详情

LMCache/LMCache

通过最快的KV缓存层为您的LLM加速

amd cuda fast

LMCache 开发者

7.8k

1.1k

295

+632

排名 #12

4月1日

查看详情

NVIDIA/warp

一个用于加速仿真、数据生成和空间计算的 Python 框架。

cuda differentiable-programming gpu

6.6k

509

333

+18

排名 #16

5月16日

查看详情

shader-slang/slang

简化着色器开发流程

cuda d3d12 glsl

shader-slang 开发者

5.3k

447

436

+12

排名 #23

5月15日

查看详情

flashinfer-ai/flashinfer

FlashInfer：大语言模型服务的核心计算库

attention cuda distributed-inference

flashinfer-ai 开发者

4.8k

670

419

+14

排名 #7

1月27日

查看详情

NVIDIA/nccl

面向集体多GPU通信的优化原语

communications cpp cuda

4.7k

1.3k

331

+34

排名 #15

5月23日

查看详情

iree-org/iree

一个基于MLIR的可重定向机器学习编译器与运行时工具包。

compiler cuda jax

iree-org 开发者

3.7k

884

459

排名 #18

4月15日

查看详情

thu-ml/SageAttention

Cuda

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升，且在语言、图像和视频模型上保持端到端指标无损。

attention cuda efficient-attention

thu-ml 开发者

3.4k

422

351

+149

排名 #15

5月24日

查看详情

MrNeRF/LichtFeld-Studio

LichtFeld工作室：现实与数字世界的交融之处

computer-graphics computer-vision cuda

MrNeRF 开发者

3.1k

339

340

+135

排名 #18

5月21日

查看详情

BBuf/how-to-optim-algorithm-in-cuda

Cuda

如何在CUDA中优化某些算法

cuda llm

BBuf 开发者

277

347

+84

排名 #15

5月24日

查看详情

NVIDIA/gpu-operator

NVIDIA GPU Operator可在Kubernetes中创建、配置和管理GPU

cuda gpu kubernetes