acceleration

话题找到数量

microsoft/onnxruntime

ONNX Runtime:跨平台高性能机器学习推理与训练加速引擎

19k
3.8k
313
+21
排名 #20
4月8日
查看详情

NVIDIA/TensorRT

NVIDIA® TensorRT™是用于NVIDIA GPU高性能深度学习推理的SDK,本仓库包含其开源组件

12k
2.3k
189
+7
排名 #24
3月26日
查看详情

H-M-H/Weylus

将您的平板设备用作计算机的绘图板或触摸屏。

8.8k
358
183
+5
排名 #11
2月14日
查看详情

NVIDIA/warp

一个用于加速仿真、数据生成和空间计算的 Python 框架。

6.4k
464
215
+18
排名 #16
3月20日
查看详情

linearmouse/linearmouse

Mac专用鼠标与触控板工具

5.5k
107
137
+2
排名 #19
2月4日
查看详情

NVIDIA/GenerativeAIExamples

面向加速基础设施与微服务架构优化的生成式AI参考工作流

3.9k
1k
225
+21
排名 #15
4月6日
查看详情

thu-ml/SageAttention

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3.3k
391
182
+149
排名 #15
4月9日
查看详情

Project-HAMi/HAMi

异构AI计算虚拟化中间件(CNCF孵化项目)

3.2k
495
123
+13
排名 #9
3月27日
查看详情

NVIDIA/cccl

CUDA核心计算库

2.3k
372
258
+7
排名 #20
4月2日
查看详情

sabamdarif/termux-desktop

通过Termux X11在Android设备上安装完整Linux桌面环境(可选VNC)并启用硬件加速

1.7k
746
143
+24
排名 #15
4月6日
查看详情

NVlabs/sionna

Sionna:用于通信系统研究的开源库

1.3k
360
180
+2
排名 #18
1月28日
查看详情

hughperkins/VeriGPU

基于RISC-V指令集架构的开源GPU设计,采用Verilog实现

1.3k
137
170
+50
排名 #12
2月28日
查看详情

thu-ml/SpargeAttn

SpargeAttention:一种免训练的稀疏注意力机制,可加速任何模型推理

951
87
203
+4
排名 #16
2月25日
查看详情

fpgasystems/Coyote

该框架为常见现代异构平台提供操作系统抽象和一系列共享网络与内存服务。

327
97
117
排名 #5
2月25日
查看详情
助手