multi-modal

话题找到数量

OpenBMB/MiniCPM-o

一款适用于手机端视觉、语音及全双工多模态直播的Gemini 2.5 Flash级别多模态大语言模型

23k
1.8k
162
+503
排名 #16
2月15日
查看详情

agentscope-ai/agentscope

构建并运行您能看见、理解且信任的智能体。

22k
2.2k
172
+1.2k
排名 #15
3月29日
查看详情

HKUDS/RAG-Anything

RAG-Anything:一体化检索增强生成框架

15k
1.8k
168
+627
排名 #16
4月5日
查看详情

TEN-framework/ten-framework

面向对话式语音人工智能代理的开源框架。

10k
1.2k
151
+28
排名 #18
3月4日
查看详情

valhalla/valhalla

基于OpenStreetMap的开源路由引擎

5.6k
871
166
+13
排名 #18
3月27日
查看详情
助手