inference
共找到 27 个相关项目
gitleaks/gitleaks
使用Gitleaks 🔑 发现密钥 (注:根据技术文档惯例,"secrets"在此语境中指代密钥、凭证等敏感信息,采用"密钥"译法符合行业标准;保留工具名称"Gitleaks"不译;添加"使用"二字使中文表达更完整自然;表情符号位置根据中文阅读习惯调整)
25k
1.9k
78
+119
NVIDIA/TensorRT
NVIDIA® TensorRT™是用于NVIDIA GPU高性能深度学习推理的SDK,本仓库包含其开源组件
12k
2.3k
53
+6
katanemo/plano
智能体应用交付基础设施——Plano是面向AI原生的代理与数据平面,可卸载底层管道工作,让您专注于智能体核心逻辑开发(支持任意AI框架)。
5.1k
290
75
+63
thu-ml/SageAttention
量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。
3.2k
355
62
+149