项目竞品

共找到 20 个竞品
AUTOMATIC1111

AUTOMATIC1111/stable-diffusion-webui

161.2k 30.1k

Stable Diffusion网页界面

Python image-generation
相似度
20%
+359
Comfy-Org

Comfy-Org/ComfyUI

103.7k 11.8k

最强大且模块化的扩散模型图形用户界面、应用程序接口及后端,提供基于图或节点的交互界面。

Python comfyui
相似度
20%
+130
unslothai

unslothai/unsloth

52.6k 4.4k

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

Python tts
相似度
20%
+538
DrewThomasson

DrewThomasson/ebook2audiobook

18.2k 1.5k

从电子书生成有声书,支持语音克隆及1107种以上语言!

Python tts
相似度
20%
+622
NVIDIA-NeMo

NVIDIA-NeMo/NeMo

16.8k 3.3k

专为从事大语言模型、多模态和语音人工智能(自动语音识别与文本转语音)的研究人员和开发者打造的可扩展生成式AI框架

Python tts
相似度
20%
+11
OpenBMB

OpenBMB/VoxCPM

5.9k 707

VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统

Python tts
相似度
20%
+1.5k
GetStream

GetStream/Vision-Agents

5.8k 462

Stream 推出的开放视觉智能体平台。使用任意模型或视频提供商快速构建视觉智能体。利用 Stream 的边缘网络实现超低延迟。

Python tts
相似度
20%
+953
hao-ai-lab

hao-ai-lab/FastVideo

3.1k 260

面向加速视频生成的统一推理与训练后处理框架

Python video-generation
相似度
20%
+9
Tencent-Hunyuan

Tencent-Hunyuan/HunyuanImage-3.0

2.8k 137

HunyuanImage-3.0:一个强大的原生多模态图像生成模型

Python image-generation
相似度
20%
+27
GVCLab

GVCLab/PersonaLive

2.2k 302

[CVPR 2026] PersonaLive!:面向直播的富有表现力肖像图像动画

Python video-generation
相似度
20%
+371
HKUDS

HKUDS/ViMax

2.1k 395

ViMax:全能型智能体视频生成系统(集成导演、编剧、制片与视频生成功能)

Python video-generation
相似度
20%
+95
mudler

mudler/LocalAI

43.0k 3.6k

🤖 开源免费的OpenAI、Claude及其他AI平台的替代方案。支持自主托管且本地优先,可作为OpenAI的即插即用替代方案运行于消费级硬件,无需GPU。兼容gguf、transformers、diffusers等多种模型架构。功能包括:文本生成、音频处理、视频制作、图像生成、语音克隆、分布式点对点推理。

Go image-generation tts
相似度
40%
+49
mcmonkeyprojects

mcmonkeyprojects/SwarmUI

3.8k 371

SwarmUI(前称StableSwarmUI),一款模块化Stable Diffusion网络用户界面,重点实现功能工具的便捷访问、高性能与可扩展性。

C# comfyui image-generation
相似度
40%
+45
mastra-ai

mastra-ai/mastra

21.1k 1.5k

TypeScript AI智能体框架 ⚡ 支持助手、RAG和可观测性。兼容所有大语言模型:GPT-4、Claude、Gemini、Llama

TypeScript tts
相似度
20%
+309
readest

readest/readest

18.1k 976

Readest是一款功能丰富的现代电子书阅读器,专为热爱阅读的用户设计,提供无缝跨平台访问、强大工具和直观界面,以提升您的阅读体验。

TypeScript tts
相似度
20%
+494
duixcom

duixcom/Duix-Avatar

12.4k 2.0k

🚀 真正开源的 AI 数字人工具包,支持离线视频生成与数字人克隆

C video-generation
相似度
20%
+13
rhasspy

rhasspy/piper

10.6k 911

一款快速、本地的神经文本转语音系统

C++ tts
相似度
20%
+51
krillinai

krillinai/KrillinAI

9.5k 815

基于大语言模型的视频翻译配音工具,支持99种语言双向翻译,提供一键式全流程部署,可生成适配YouTube、TikTok和Shorts等平台的内容

Go tts
相似度
20%
+28
LykosAI

LykosAI/StabilityMatrix

7.6k 521

稳定扩散跨平台包管理器

C# comfyui
相似度
20%
+256
leejet

leejet/stable-diffusion.cpp

5.3k 513

纯C/C++实现的扩散模型(SD/Flux/Wan等)推理框架

C++ image-generation
相似度
20%
+102
助手