项目竞品

共找到 20 个竞品
Blaizzy

Blaizzy/mlx-audio

5.7k 411

一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库,可在Apple Silicon芯片上实现高效语音分析。

Python mlx speech-to-text text-to-speech
相似度
33%
+2.0k
dinoki-ai

dinoki-ai/osaurus

3.5k 140

原生支持Apple Silicon的LLM服务器,具备MCP支持。

Swift mlx
相似度
11%
+200
ml-explore

ml-explore/mlx-swift-examples

2.4k 355

MLX Swift 使用示例集

Swift mlx
相似度
11%
+2
unslothai

unslothai/unsloth

52.6k 4.4k

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

Python text-to-speech tts
相似度
22%
+538
rhasspy

rhasspy/piper

10.6k 911

一款快速、本地的神经文本转语音系统

C++ text-to-speech tts
相似度
22%
+51
k2-fsa

k2-fsa/sherpa-onnx

10.3k 1.2k

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。

C++ speech-to-text text-to-speech
相似度
22%
+34
OpenBMB

OpenBMB/VoxCPM

5.9k 707

VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统

Python text-to-speech tts
相似度
22%
+1.5k
GetStream

GetStream/Vision-Agents

5.8k 462

Stream 推出的开放视觉智能体平台。使用任意模型或视频提供商快速构建视觉智能体。利用 Stream 的边缘网络实现超低延迟。

Python stt tts
相似度
22%
+953
pluja

pluja/whishper

2.9k 167

通过网页界面100%本地化地将任意音频转录为文本,翻译并编辑字幕。由whisper模型驱动!

Svelte speech-to-text stt
相似度
22%
+12
ggml-org

ggml-org/whisper.cpp

47.0k 5.2k

OpenAI Whisper模型的C/C++移植版本

C++ speech-to-text
相似度
11%
+1.0k
mudler

mudler/LocalAI

43.0k 3.6k

🤖 开源免费的OpenAI、Claude及其他AI平台的替代方案。支持自主托管且本地优先,可作为OpenAI的即插即用替代方案运行于消费级硬件,无需GPU。兼容gguf、transformers、diffusers等多种模型架构。功能包括:文本生成、音频处理、视频制作、图像生成、语音克隆、分布式点对点推理。

Go tts
相似度
11%
+49
ml-explore

ml-explore/mlx

23.8k 1.5k

MLX:适用于 Apple 芯片的数组框架

C++ mlx
相似度
11%
+107
mastra-ai

mastra-ai/mastra

21.1k 1.5k

TypeScript AI智能体框架 ⚡ 支持助手、RAG和可观测性。兼容所有大语言模型:GPT-4、Claude、Gemini、Llama

TypeScript tts
相似度
11%
+309
m-bain

m-bain/whisperX

19.9k 2.1k

WhisperX:具备词级时间戳标注的自动语音识别系统

Python speech-to-text
相似度
11%
+17
DrewThomasson

DrewThomasson/ebook2audiobook

18.2k 1.5k

从电子书生成有声书,支持语音克隆及1107种以上语言!

Python tts
相似度
11%
+622
readest

readest/readest

18.1k 976

Readest是一款功能丰富的现代电子书阅读器,专为热爱阅读的用户设计,提供无缝跨平台访问、强大工具和直观界面,以提升您的阅读体验。

TypeScript tts
相似度
11%
+494
NVIDIA-NeMo

NVIDIA-NeMo/NeMo

16.8k 3.3k

专为从事大语言模型、多模态和语音人工智能(自动语音识别与文本转语音)的研究人员和开发者打造的可扩展生成式AI框架

Python tts
相似度
11%
+11
cjpais

cjpais/Handy

15.8k 1.1k

完全离线的免费开源可扩展语音转文本应用程序

TypeScript speech-to-text
相似度
11%
+4.2k
Zackriya-Solutions

Zackriya-Solutions/meeting-minutes

9.8k 882

一款免费开源、基于人工智能的自托管实时会议记录与纪要生成工具,可完全在本地设备运行(已支持Mac OS和Windows系统,即将新增Linux支持)https://meetily.zackriya.com/ 这就是meetly ai

Rust speech-to-text
相似度
11%
+143
espeak-ng

espeak-ng/espeak-ng

6.1k 1.2k

eSpeak NG是开源语音合成器,支持上百种语言和口音

C text-to-speech
相似度
11%
+34
助手