asr

共找到 5 个相关项目

m-bain/whisperX

WhisperX:具备词级时间戳标注的自动语音识别系统

19k
2.1k
104
+17
排名 #9
2月1日
查看详情

NVIDIA-NeMo/NeMo

专为从事大语言模型、多模态和语音人工智能(自动语音识别与文本转语音)的研究人员和开发者打造的可扩展生成式AI框架

16k
3.3k
53
+11
排名 #7
2月19日
查看详情

k2-fsa/sherpa-onnx

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。

10k
1.2k
77
+34
排名 #21
2月13日
查看详情

umlx5h/LLPlayer

专为语言学习打造的媒体播放器,具备双语字幕、AI生成字幕、实时翻译等功能!

3.1k
153
78
+391
排名 #8
2月16日
查看详情

amicalhq/amical

🎙️ AI Dictation App - Open Source and Local-first ⚡ Type 3x faster, no keyboard needed. 🆓 Powered by open source models, works offline, fast and accurate.

773
74
65
+8
排名 #6
2月15日
查看详情
助手