vlm

话题找到数量

huggingface/transformers

🤗 Transformers:面向文本、视觉、音频及多模态模型的尖端机器学习模型定义框架,支持推理与训练全流程。

156k
32k
355
+50
排名 #8
2月11日
查看详情

bytedance/UI-TARS-desktop

开源多模态AI智能体堆栈,连接尖端AI模型与智能体基础设施

28k
2.8k
255
+4.8k
排名 #12
2月28日
查看详情

sgl-project/sglang

SGLang是面向大语言模型与视觉语言模型的高速推理框架。

23k
4.3k
332
+128
排名 #9
2月6日
查看详情

RunanywhereAI/runanywhere-sdks

可在本地运行AI的生产就绪工具包

10k
333
200
+5.6k
排名 #17
3月22日
查看详情

roboflow/notebooks

一套关于前沿计算机视觉模型与技术的教程合集,涵盖从ResNet等基础架构到YOLO11、RT-DETR、SAM 2、Florence-2、PaliGemma 2和Qwen2.5VL等尖端模型的全方位探索。

9.2k
1.4k
215
+7
排名 #14
2月6日
查看详情

oumi-ai/oumi

轻松微调、评估和部署gpt-oss、Qwen3、DeepSeek-R1或任何开源LLM/VLM!

9.1k
738
107
+29
排名 #14
4月3日
查看详情

NexaAI/nexa-sdk

通过Python、Android Java和iOS Swift绑定,在GPU、NPU和CPU上运行最新的LLM和VLM模型,快速部署OpenAI gpt-oss、Gemma 3、Qwen3等主流模型。

7.9k
971
151
+63
排名 #11
3月22日
查看详情

OpenBMB/UltraRAG

UltraRAG v3:一个用于构建复杂创新RAG管道的低代码MCP框架

5.4k
387
176
+2.6k
排名 #13
3月3日
查看详情

SharpAI/DeepCamera

开源AI相机技能平台,AI网络视频录像机与闭路电视监控系统。

2.5k
410
107
+45
排名 #4
3月23日
查看详情

InternRobotics/InternNav

InternRobotics 用于构建通用导航基础模型的开源平台

751
96
157
+6
排名 #20
3月27日
查看详情

Tencent/AngelSlim

Model compression toolkit engineered for enhanced usability, comprehensiveness, and efficiency.

424
46
163
+15
排名 #9
2月12日
查看详情

NVIDIA-NeMo/Automodel

专为大语言模型/视觉语言模型设计的PyTorch分布式原生训练库,开箱即用支持Hugging Face

321
70
188
+4
排名 #5
2月18日
查看详情
助手