text-to-speech

话题找到数量

unslothai/unsloth

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

60k
5.2k
324
+6.1k
排名 #19
4月8日
查看详情

jianchang512/pyvideotrans

将视频从一种语言翻译为另一种语言,并嵌入配音与字幕。

16k
2k
72
+72
排名 #12
3月30日
查看详情

k2-fsa/sherpa-onnx

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。

11k
1.3k
228
+223
排名 #21
4月9日
查看详情

rhasspy/piper

一款快速、本地的神经文本转语音系统

10k
916
209
+51
排名 #20
3月8日
查看详情

OpenBMB/VoxCPM

VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统

7.6k
907
253
+1.5k
排名 #11
4月9日
查看详情

Blaizzy/mlx-audio

一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库,可在Apple Silicon芯片上实现高效语音分析。

6.3k
493
217
+2k
排名 #13
3月15日
查看详情

espeak-ng/espeak-ng

eSpeak NG是开源语音合成器,支持上百种语言和口音

6.2k
1.2k
174
+34
排名 #21
3月9日
查看详情

rapidaai/voice-ai

Rapida是一个开源、端到端的语音AI编排平台,用于构建具备音频流、语音识别、语音合成、语音活动检测、多通道集成、智能体状态管理和可观测性的实时对话语音智能体。

710
204
128
+13
排名 #16
4月9日
查看详情

Blaizzy/mlx-audio-swift

一个用于在Apple Silicon上使用MLX进行音频处理的模块化Swift SDK

534
72
148
+161
排名 #16
4月5日
查看详情
助手