cuda

话题找到数量

vllm-project/vllm

面向大语言模型的高吞吐量与内存优化型推理服务引擎

71k
13k
269
+182
排名 #11
3月4日
查看详情

nagadomi/waifu2x

动漫风格图像超分辨率技术

28k
2.7k
223
+38
排名 #19
3月22日
查看详情

hashcat/hashcat

全球最快最先进的密码恢复工具

25k
3.4k
214
+17
排名 #17
3月23日
查看详情

sgl-project/sglang

SGLang是面向大语言模型与视觉语言模型的高速推理框架。

23k
4.3k
279
+128
排名 #9
2月6日
查看详情

NVlabs/instant-ngp

即时神经图形原语:极速神经辐射场(NeRF)及其他技术

17k
2.1k
228
+92
排名 #15
4月9日
查看详情

tracel-ai/burn

Burn是下一代深度学习框架,在灵活性、效率和可移植性方面毫不妥协。

14k
825
271
+113
排名 #11
2月21日
查看详情

isl-org/Open3D

Open3D:面向三维数据处理的现代算法库

13k
2.5k
226
+34
排名 #17
4月1日
查看详情

taskflow/taskflow

基于现代C++的通用任务并行编程系统

11k
1.4k
110
+4
排名 #12
4月2日
查看详情

rapidsai/cudf

cuDF - GPU 数据帧库

9.6k
1k
276
+28
排名 #14
3月19日
查看详情

NVIDIA/cutlass

线性代数子程序的CUDA模板

9.5k
1.7k
294
+198
排名 #23
3月25日
查看详情

replicate/cog

机器学习容器

9.4k
683
69
+17
排名 #1
4月3日
查看详情

NVIDIA/cuda-samples

面向CUDA开发者的示例代码库,展示CUDA工具包功能特性

9k
2.3k
165
+9
排名 #15
3月31日
查看详情

LMCache/LMCache

通过最快的KV缓存层为您的LLM加速

7.8k
1.1k
162
+632
排名 #12
4月1日
查看详情

NVIDIA/warp

一个用于加速仿真、数据生成和空间计算的 Python 框架。

6.4k
464
192
+18
排名 #16
3月20日
查看详情

shader-slang/slang

简化着色器开发流程

5.1k
431
248
+12
排名 #23
3月21日
查看详情

flashinfer-ai/flashinfer

FlashInfer:大语言模型服务的核心计算库

4.8k
670
245
+14
排名 #7
1月27日
查看详情

NVIDIA/nccl

面向集体多GPU通信的优化原语

4.6k
1.2k
172
+7
排名 #15
3月25日
查看详情

iree-org/iree

一个基于MLIR的可重定向机器学习编译器与运行时工具包。

3.7k
871
308
+5
排名 #16
3月28日
查看详情

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.3k
391
182
+149
排名 #15
4月9日
查看详情

BBuf/how-to-optim-algorithm-in-cuda

如何在CUDA中优化某些算法

2.9k
267
173
+84
排名 #15
4月7日
查看详情

MrNeRF/LichtFeld-Studio

LichtFeld工作室:现实与数字世界的交融之处

2.8k
285
159
+135
排名 #16
4月5日
查看详情

diku-dk/futhark

💥💻💥 一种数据并行的函数式编程语言

2.7k
197
183
+1
排名 #9
2月12日
查看详情

NVIDIA/cccl

CUDA核心计算库

2.3k
372
253
+7
排名 #20
4月2日
查看详情

rapidsai/cugraph

cuGraph - RAPIDS 图分析库

2.1k
345
153
+2
排名 #13
3月5日
查看详情
助手