项目竞品项目

项目竞品项目数量
m-bain

m-bain/whisperX

相关项目
19.9k 2.1k

WhisperX:具备词级时间戳标注的自动语音识别系统

Python speech-recognition speech-to-text
项目竞品项目相似度
45%
+17
jianchang512

jianchang512/pyvideotrans

相关项目
16.7k 2.0k

将视频从一种语言翻译为另一种语言,并嵌入配音与字幕。

Python speech-to-text text-to-speech
项目竞品项目相似度
45%
+72
OpenBMB

OpenBMB/VoxCPM

相关项目
9.9k 1.2k

VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统

Python speech-synthesis text-to-speech
项目竞品项目相似度
45%
+1.5k
huggingface

huggingface/speech-to-speech

相关项目
4.4k 500

语音转语音:致力于构建开源模块化GPT4-o的项目

Python speech-synthesis speech-to-text
项目竞品项目相似度
45%
+35
ggml-org

ggml-org/whisper.cpp

相关项目
48.5k 5.4k

OpenAI Whisper模型的C/C++移植版本

C++ speech-recognition speech-to-text
项目竞品项目相似度
30%
+1.0k
alphacep

alphacep/vosk-api

相关项目
14.3k 1.7k

适用于Android、iOS、树莓派及服务端的离线语音识别API,支持Python、Java、C#和Node.js开发语言。

Jupyter Notebook speech-recognition speech-to-text
项目竞品项目相似度
30%
+2
k2-fsa

k2-fsa/sherpa-onnx

相关项目
11.5k 1.3k

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。

C++ speech-to-text text-to-speech
项目竞品项目相似度
30%
+223
rhasspy

rhasspy/piper

相关项目
10.7k 916

一款快速、本地的神经文本转语音系统

C++ speech-synthesis text-to-speech
项目竞品项目相似度
30%
+51
openvinotoolkit

openvinotoolkit/openvino

相关项目
10.0k 3.2k

OpenVINO™是用于优化和部署AI推理的开源工具套件

C++ speech-recognition transformers
项目竞品项目相似度
30%
+207
espeak-ng

espeak-ng/espeak-ng

相关项目
6.2k 1.2k

eSpeak NG是开源语音合成器,支持上百种语言和口音

C speech-synthesis text-to-speech
项目竞品项目相似度
30%
+34
argmaxinc

argmaxinc/WhisperKit

相关项目
6.0k 541

适用于Apple Silicon设备的本地语音识别

Swift speech-recognition transformers
项目竞品项目相似度
30%
+202
MahmoudAshraf97

MahmoudAshraf97/whisper-diarization

相关项目
5.4k 500

基于OpenAI Whisper的说话人日志自动语音识别系统

Jupyter Notebook speech-recognition speech-to-text
项目竞品项目相似度
30%
+4
pluja

pluja/whishper

相关项目
3.0k 172

通过网页界面100%本地化地将任意音频转录为文本,翻译并编辑字幕。由whisper模型驱动!

Svelte speech-recognition speech-to-text
项目竞品项目相似度
30%
+48
rapidaai

rapidaai/voice-ai

相关项目
710 204

Rapida是一个开源、端到端的语音AI编排平台,用于构建具备音频流、语音识别、语音合成、语音活动检测、多通道集成、智能体状态管理和可观测性的实时对话语音智能体。

Go speech-to-text text-to-speech
项目竞品项目相似度
30%
+13
Blaizzy

Blaizzy/mlx-vlm

相关项目
4.1k 436

MLX-VLM:基于MLX在Mac上进行视觉语言模型推理与微调的工具包

Python apple-silicon mlx
项目竞品项目相似度
29%
+499
Blaizzy

Blaizzy/mlx-audio-swift

相关项目
534 72

一个用于在Apple Silicon上使用MLX进行音频处理的模块化Swift SDK

Swift mlx speech-to-text text-to-speech
项目竞品项目相似度
24%
+161
助手