项目竞品项目

项目竞品项目数量
rapidaai

rapidaai/voice-ai

相关项目
710 204

Rapida是一个开源、端到端的语音AI编排平台,用于构建具备音频流、语音识别、语音合成、语音活动检测、多通道集成、智能体状态管理和可观测性的实时对话语音智能体。

Go speech-to-text text-to-speech
项目竞品项目相似度
30%
+13
Blaizzy

Blaizzy/mlx-audio

相关项目
6.3k 493

一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库,可在Apple Silicon芯片上实现高效语音分析。

Python mlx speech-to-text text-to-speech
项目竞品项目相似度
24%
+2.0k
pluja

pluja/whishper

相关项目
3.0k 172

通过网页界面100%本地化地将任意音频转录为文本,翻译并编辑字幕。由whisper模型驱动!

Svelte speech-to-text stt
项目竞品项目相似度
20%
+48
rhasspy

rhasspy/piper

相关项目
10.7k 916

一款快速、本地的神经文本转语音系统

C++ text-to-speech tts
项目竞品项目相似度
14%
+51
OpenBMB

OpenBMB/VoxCPM

相关项目
7.6k 907

VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统

Python text-to-speech tts
项目竞品项目相似度
14%
+1.5k
jianchang512

jianchang512/pyvideotrans

相关项目
16.7k 2.0k

将视频从一种语言翻译为另一种语言,并嵌入配音与字幕。

Python speech-to-text text-to-speech
项目竞品项目相似度
12%
+72
k2-fsa

k2-fsa/sherpa-onnx

相关项目
11.5k 1.3k

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。

C++ speech-to-text text-to-speech
项目竞品项目相似度
12%
+223
unslothai

unslothai/unsloth

相关项目
60.3k 5.2k

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

Python text-to-speech tts
项目竞品项目相似度
8%
+6.1k
alphacep

alphacep/vosk-api

相关项目
14.3k 1.7k

适用于Android、iOS、树莓派及服务端的离线语音识别API,支持Python、Java、C#和Node.js开发语言。

Jupyter Notebook speech-to-text stt
项目竞品项目相似度
8%
+2
GetStream

GetStream/Vision-Agents

相关项目
7.1k 536

Stream 推出的开放视觉智能体平台。使用任意模型或视频提供商快速构建视觉智能体。利用 Stream 的边缘网络实现超低延迟。

Python stt tts
项目竞品项目相似度
6%
+953
助手