multimodal

话题找到数量

Mintplex-Labs/anything-llm

内置RAG、AI智能体、无代码智能体构建器、MCP兼容等功能的桌面与Docker一体化AI应用

57k
6.2k
268
+2.3k
排名 #16
4月5日
查看详情

bytedance/UI-TARS-desktop

开源多模态AI智能体堆栈,连接尖端AI模型与智能体基础设施

28k
2.8k
247
+4.8k
排名 #12
2月28日
查看详情

screenpipe/screenpipe

screenpipe将您的电脑转变为个人AI助手,它能知晓您的一切操作。记录、搜索、自动化,全部本地运行,完全私密,尽在您掌控。

18k
1.6k
121
+912
排名 #14
4月5日
查看详情

modelscope/ms-swift

使用PEFT或全参数方法对500余个大语言模型和200余个多模态大语言模型进行CPT/SFT/DPO/GRPO训练

12k
1.2k
139
+26
排名 #9
2月27日
查看详情

duixcom/Duix-Avatar

🚀 真正开源的 AI 数字人工具包,支持离线视频生成与数字人克隆

12k
2.1k
146
+76
排名 #11
4月9日
查看详情

salesforce/LAVIS

LAVIS——语言视觉智能一站式算法库

11k
1.1k
209
+2
排名 #4
1月30日
查看详情

RunanywhereAI/runanywhere-sdks

可在本地运行AI的生产就绪工具包

10k
333
200
+5.6k
排名 #17
3月22日
查看详情

rerun-io/rerun

可视化多模态数据流。免费、快速、易用且易于集成。基于Rust构建。

10k
657
231
+77
排名 #19
2月21日
查看详情

apache/seatunnel

SeaTunnel是多模态、高性能、分布式海量数据集成工具

9.2k
2.2k
339
+6
排名 #11
4月1日
查看详情

X-PLUG/MobileAgent

Mobile-Agent:强大的GUI智能体家族

8k
808
132
+412
排名 #17
3月8日
查看详情

AI4Finance-Foundation/FinRobot

FinRobot:基于大语言模型的金融分析开源AI智能体平台🚀 🚀 🚀

6.6k
1.1k
174
+1.2k
排名 #17
4月6日
查看详情

RunanywhereAI/runanywhere-sdks

可在本地运行AI的生产就绪工具包

6.6k
205
200
+1.8k
排名 #16
2月8日
查看详情

Blaizzy/mlx-audio

一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库,可在Apple Silicon芯片上实现高效语音分析。

6.3k
493
209
+2k
排名 #13
3月15日
查看详情

Eventual-Inc/Daft

分布式查询引擎,为任何模态和规模的数据处理提供简单可靠的解决方案

5.4k
436
199
+37
排名 #21
4月5日
查看详情

OpenBMB/UltraRAG

UltraRAG v3:一个用于构建复杂创新RAG管道的低代码MCP框架

5.4k
387
172
+2.6k
排名 #13
3月3日
查看详情

vllm-project/vllm-omni

一个面向全模态模型的高效推理框架。

4k
647
192
+530
排名 #15
3月29日
查看详情

HenryNdubuaku/maths-cs-ai-compendium

成为顶尖的人工智能与机器学习研究工程师

2.9k
423
43
+603
排名 #14
4月5日
查看详情

Tencent-Hunyuan/HunyuanImage-3.0

HunyuanImage-3.0:一个强大的原生多模态图像生成模型

2.8k
137
111
+27
排名 #10
1月30日
查看详情

vortex-data/vortex

可扩展的尖端列式文件格式。原属@spiraldb项目,现为Linux基金会托管项目

2.7k
132
184
+20
排名 #17
2月14日
查看详情

NVIDIA-NeMo/DataDesigner

🎨 NeMo数据设计器:从零开始或基于种子数据生成高质量合成数据

1.5k
132
39
+244
排名 #9
4月7日
查看详情
助手