项目竞品
共找到 14 个竞品k2-fsa/sherpa-onnx
基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。
OpenBMB/VoxCPM
VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统
unslothai/unsloth
大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存
NVIDIA-NeMo/NeMo
专为从事大语言模型、多模态和语音人工智能(自动语音识别与文本转语音)的研究人员和开发者打造的可扩展生成式AI框架
espeak-ng/espeak-ng
eSpeak NG是开源语音合成器,支持上百种语言和口音
Blaizzy/mlx-audio
一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库,可在Apple Silicon芯片上实现高效语音分析。
Blaizzy/mlx-audio-swift
一个用于在Apple Silicon上使用MLX进行音频处理的模块化Swift SDK
mudler/LocalAI
🤖 开源免费的OpenAI、Claude及其他AI平台的替代方案。支持自主托管且本地优先,可作为OpenAI的即插即用替代方案运行于消费级硬件,无需GPU。兼容gguf、transformers、diffusers等多种模型架构。功能包括:文本生成、音频处理、视频制作、图像生成、语音克隆、分布式点对点推理。
mastra-ai/mastra
TypeScript AI智能体框架 ⚡ 支持助手、RAG和可观测性。兼容所有大语言模型:GPT-4、Claude、Gemini、Llama
DrewThomasson/ebook2audiobook
从电子书生成有声书,支持语音克隆及1107种以上语言!
readest/readest
Readest是一款功能丰富的现代电子书阅读器,专为热爱阅读的用户设计,提供无缝跨平台访问、强大工具和直观界面,以提升您的阅读体验。
GetStream/Vision-Agents
Stream 推出的开放视觉智能体平台。使用任意模型或视频提供商快速构建视觉智能体。利用 Stream 的边缘网络实现超低延迟。
huggingface/speech-to-speech
语音转语音:致力于构建开源模块化GPT4-o的项目
stakira/OpenUtau
开放歌声合成平台/开源UTAU后继项目
相关项目推荐
tensorflow/tensorflow
面向所有人的开源机器学习框架
facebook/react-native
一个使用React构建原生应用程序的框架
electron/electron
使用 JavaScript、HTML 和 CSS 构建跨平台桌面应用程序
godotengine/godot
Godot引擎——跨平台2D与3D游戏引擎
microsoft/terminal
全新Windows Terminal与经典Windows控制台主机,集于一处!
ggml-org/llama.cpp
使用 C/C++ 实现的大语言模型推理框架