❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

vllm

话题找到数量

meta-llama/llama-cookbook

欢迎来到Llama实践指南!这是您使用Llama进行开发的必备指南:涵盖推理入门、微调及RAG技术。我们还将展示如何利用Llama模型家族解决端到端问题,并在不同云服务平台上进行部署

18k
2.7k
313
+23
排名 #14
2月16日
查看详情

modelscope/FunASR

端到端语音识别基础工具包与开源SOTA预训练模型,支持语音识别、语音活动检测、文本后处理等功能。

16k
1.7k
404
+42
排名 #16
5月26日
查看详情

LMCache/LMCache

通过最快的KV缓存层为您的LLM加速

7.8k
1.1k
300
+632
排名 #12
4月1日
查看详情

Orchestra-Research/AI-Research-SKILLs

面向任意AI模型的综合性开源人工智能研究与工程技能库。

6.2k
485
272
+1.8k
排名 #11
4月5日
查看详情

kserve/kserve

面向 Kubernetes 可扩展多框架部署的标准化分布式生成式与预测式 AI 推理平台

5.5k
1.5k
347
+8
排名 #18
5月12日
查看详情

kvcache-ai/Mooncake

Mooncake是Moonshot AI旗下领先大语言模型服务Kimi的部署平台。

5.4k
787
381
+64
排名 #21
5月26日
查看详情

OpenBMB/UltraRAG

UltraRAG v3:一个用于构建复杂创新RAG管道的低代码MCP框架

5.4k
387
322
+2.6k
排名 #13
3月3日
查看详情

mostlygeek/llama-swap

llama.cpp(或任何兼容本地OpenAI API的服务器)的模型热替换

4.1k
316
259
+779
排名 #19
5月16日
查看详情

vllm-project/semantic-router

面向混合模型的智能路由器。

3.9k
642
389
+479
排名 #15
4月26日
查看详情

vllm-project/vllm-ascend

面向昇腾平台的vLLM社区维护硬件插件

2.1k
1.3k
523
+25
排名 #20
5月26日
查看详情

vllm-project/vllm-ascend

面向昇腾平台的vLLM社区维护硬件插件

2.1k
1.2k
523
+31
排名 #11
5月10日
查看详情

SemiAnalysisAI/InferenceX

开源持续推理基准测试:Qwen3.5、DeepSeek、GPTOSS - GB200 NVL72对比MI355X、B200、GB300 NVL72、H100,即将支持TPUv6e/v7/Trainium2/3

500
86
317
+6
排名 #6
2月18日
查看详情
助手