❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

ztxz16

ztxz16/fastllm

C++ 活跃
129
2026-05-17
4.6k
+136
#5
461

项目介绍

fastllm 是零后端依赖的高性能大模型推理库,支持张量并行推理稠密模型与混合模式推理 MOE 模型,任意 10G 以上显存显卡即可完整推理 DeepSeek 模型。在双路 9004/9005 服务器搭配单显卡部署完整精度原版 DeepSeek 模型时,单并发达 20tps;INT4 量化模型单并发 30tps,多并发可达 60+tps。

fastllm是后端无依赖的高性能大模型推理库。同时支持张量并行推理稠密模型和混合模式推理MOE模型,任意10G以上显卡即可推理满血DeepSeek。双路9004/9005服务器+单显卡部署DeepSeek满血满精度原版模型,单并发20tps;INT4量化模型单并发30tps,多并发可达60+。

智能解读

点击生成更详细的项目介绍

智能标签

生成技术栈、用途、特征、受众等多维度标签

使用场景

了解这个项目能帮你解决什么问题

项目健康度

B
64/100
良好
活跃度人气增长社区文档
活跃度 15/23

距上次更新 14 天

人气 22/25

平台 Star TOP 13% · Forks 461

增长 14/25

本周 +136 ⭐ · 本月 +544 ⭐

社区 10/17

48 位贡献者 · 0 条平台评论

文档 3/10

缺少 4 项内容

1 项改进建议
  • 文档:完善项目文档(截图、AI 分析等)可提升健康度得分
在 GitHub 上查看

项目信息

作者 ztxz16
来源 GitHub
周期 每周
仓库ID ztxz16/fastllm
最新提交 2026-05-14 16:00:43
第一收录 2026-05-18 10:11:15
最后更新 2026-05-18 10:11:23

赞赏支持

如果本站对你有帮助,欢迎打赏支持

微信打赏码

微信

支付宝打赏码

支付宝

评论 0

登录 后发表评论

加载评论中...

助手