❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

asr

话题找到数量

m-bain/whisperX

WhisperX:具备词级时间戳标注的自动语音识别系统

19k
2.1k
419
+17
排名 #9
2月1日
查看详情

modelscope/FunASR

端到端语音识别基础工具包与开源SOTA预训练模型,支持语音识别、语音活动检测、文本后处理等功能。

17k
1.8k
461
+705
排名 #19
6月7日
查看详情

NVIDIA-NeMo/NeMo

专为从事大语言模型、多模态和语音人工智能(自动语音识别与文本转语音)的研究人员和开发者打造的可扩展生成式AI框架

17k
3.4k
600
+11
排名 #13
5月15日
查看详情

alphacep/vosk-api

适用于Android、iOS、树莓派及服务端的离线语音识别API,支持Python、Java、C#和Node.js开发语言。

14k
1.7k
365
+9
排名 #15
5月30日
查看详情

k2-fsa/sherpa-onnx

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。

12k
1.5k
393
+775
排名 #22
6月9日
查看详情

MahmoudAshraf97/whisper-diarization

基于OpenAI Whisper的说话人日志自动语音识别系统

5.4k
500
277
+4
排名 #16
3月18日
查看详情

umlx5h/LLPlayer

专为语言学习打造的媒体播放器,具备双语字幕、AI生成字幕、实时翻译等功能!

3.7k
209
365
+601
排名 #12
5月9日
查看详情

meizhong986/WhisperJAV

ASR/STT字幕生成器。采用Qwen3-ASR、本地LLM、Whisper、TEN-VAD技术,具备针对JAV场景的噪声鲁棒性

1.2k
112
251
+103
排名 #7
3月15日
查看详情

amicalhq/amical

🎙️ AI Dictation App - Open Source and Local-first ⚡ Type 3x faster, no keyboard needed. 🆓 Powered by open source models, works offline, fast and accurate.

773
74
318
+8
排名 #6
2月15日
查看详情

soniqo/speech-swift

面向 Apple Silicon 的 AI 语音工具包 — 基于 MLX 和 CoreML 的 ASR、TTS、语音到语音、VAD 及说话人分离功能。

772
103
126
+3
排名 #16
5月30日
查看详情
助手