项目介绍
支持PyTorch接口的CUDA因果深度wise一维卷积实现
Causal depthwise conv1d in CUDA, with a PyTorch interface
智能解读
智能标签
使用场景
项目健康度
距上次更新 35 天
平台 Star TOP 74% · Forks 172
本周 +14 ⭐ · 本月 +77 ⭐
15 位贡献者 · 0 条平台评论
缺少 4 项内容
2 项改进建议
- 增长:近期 Star 增长缓慢,项目热度有待提升
- 文档:完善项目文档(截图、AI 分析等)可提升健康度得分
项目信息
赞赏支持
如果本站对你有帮助,欢迎打赏支持
微信
支付宝
Widget 徽章
相关项目推荐
karpathy/llm.c
基于纯C/CUDA的简易大语言模型训练
NVlabs/instant-ngp
即时神经图形原语:极速神经辐射场(NeRF)及其他技术
deepseek-ai/FlashMLA
FlashMLA: Efficient MLA decoding kernels
HigherOrderCO/HVM
基于Rust的大规模并行最优函数运行时
deepseek-ai/DeepEP
DeepEP:高效的专家并行通信库
deepseek-ai/DeepGEMM
DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核
加载评论中...