speech

话题找到数量

JohnSnowLabs/spark-nlp

顶尖自然语言处理技术

4.1k
741
99
+2
排名 #10
4月7日
查看详情

stakira/OpenUtau

开放歌声合成平台/开源UTAU后继项目

3.7k
465
184
+7
排名 #20
3月23日
查看详情

pluja/whishper

通过网页界面100%本地化地将任意音频转录为文本,翻译并编辑字幕。由whisper模型驱动!

3k
172
205
+48
排名 #18
3月31日
查看详情

HenryNdubuaku/maths-cs-ai-compendium

成为顶尖的人工智能与机器学习研究工程师

2.9k
423
64
+603
排名 #14
4月5日
查看详情

SakiRinn/LiveCaptions-Translator

基于Windows LiveCaptions的轻量级强大实时音频/语音翻译工具

2.6k
180
170
+378
排名 #15
3月16日
查看详情

meizhong986/WhisperJAV

ASR/STT字幕生成器。采用Qwen3-ASR、本地LLM、Whisper、TEN-VAD技术,具备针对JAV场景的噪声鲁棒性

1.2k
112
122
+103
排名 #7
3月15日
查看详情

amicalhq/amical

🎙️ AI Dictation App - Open Source and Local-first ⚡ Type 3x faster, no keyboard needed. 🆓 Powered by open source models, works offline, fast and accurate.

773
74
166
+8
排名 #6
2月15日
查看详情

rapidaai/voice-ai

Rapida是一个开源、端到端的语音AI编排平台,用于构建具备音频流、语音识别、语音合成、语音活动检测、多通道集成、智能体状态管理和可观测性的实时对话语音智能体。

710
204
126
+13
排名 #16
4月9日
查看详情

Blaizzy/mlx-audio-swift

一个用于在Apple Silicon上使用MLX进行音频处理的模块化Swift SDK

534
72
144
+161
排名 #16
4月5日
查看详情
助手