❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

asr

话题找到数量

m-bain/whisperX

Python

WhisperX：具备词级时间戳标注的自动语音识别系统

asr speech speech-recognition

m-bain 开发者

19k

2.1k

603

+17

排名 #9

2月1日

查看详情

modelscope/FunASR

Python

端到端语音识别基础工具包与开源SOTA预训练模型，支持语音识别、语音活动检测、文本后处理等功能。

asr audio chinese

modelscope 开发者

18k

1.9k

664

+2.1k

排名 #19

6月30日

查看详情

NVIDIA-NeMo/Speech

Python

一个可扩展的生成式 AI 框架，专为从事大语言模型、多模态及语音 AI（自动语音识别与文本转语音）的研究人员和开发者构建。

asr deeplearning generative-ai

NVIDIA-NeMo 开发者

17k

3.5k

359

+12

排名 #11

6月25日

查看详情

NVIDIA-NeMo/NeMo

Python

专为从事大语言模型、多模态和语音人工智能（自动语音识别与文本转语音）的研究人员和开发者打造的可扩展生成式AI框架

asr deeplearning generative-ai

NVIDIA-NeMo 开发者

17k

3.4k

901

+11

排名 #22

6月12日

查看详情

alphacep/vosk-api

Jupyter Notebook

适用于Android、iOS、树莓派及服务端的离线语音识别API，支持Python、Java、C#和Node.js开发语言。

android asr deep-learning

alphacep 开发者

14k

1.7k

535

排名 #15

6月26日

查看详情

k2-fsa/sherpa-onnx

C++

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端，兼容12种编程语言。

aarch64 android arm32

k2-fsa 开发者

13k

1.6k

639

+775

排名 #22

7月22日

查看详情

MahmoudAshraf97/whisper-diarization

Jupyter Notebook

基于OpenAI Whisper的说话人日志自动语音识别系统

asr speaker-diarization speech

MahmoudAshraf97 开发者

5.4k

500

440

排名 #16

3月18日

查看详情

umlx5h/LLPlayer

专为语言学习打造的媒体播放器，具备双语字幕、AI生成字幕、实时翻译等功能！

asr csharp flyleaf

umlx5h 开发者

3.7k

209

524

+601

排名 #12

5月9日

查看详情

FluidInference/FluidAudio

Swift

在您的应用中集成前沿CoreML音频模型——文本转语音、语音转文本、语音活动检测及说话人分离。基于Swift开发，由顶尖开源技术驱动。

ane asr audio

FluidInference 开发者

2.5k

348

241

+120

排名 #12

7月16日

查看详情

handy-computer/transcribe.cpp

C++

支持16+模型家族的ggml语音转文本推理

asr ggml gguf

handy-computer 开发者

1.5k

+395

排名 #19

7月22日

查看详情

meizhong986/WhisperJAV

HTML

ASR/STT字幕生成器。采用Qwen3-ASR、本地LLM、Whisper、TEN-VAD技术，具备针对JAV场景的噪声鲁棒性

aitranslate hallucination japanese

meizhong986 开发者

1.2k

112

465

+103

排名 #7

3月15日

查看详情

soniqo/speech-swift

Swift

面向 Apple Silicon 的 AI 语音工具包 — 基于 MLX 和 CoreML 的 ASR、TTS、语音到语音、VAD 及说话人分离功能。

apple-silicon asr coreml

soniqo 开发者

977

122

314

+22

排名 #16

7月4日

查看详情

amicalhq/amical

TypeScript

🎙️ AI Dictation App - Open Source and Local-first ⚡ Type 3x faster, no keyboard needed. 🆓 Powered by open source models, works offline, fast and accurate.

ai ai-note-taking-app asr

amicalhq 开发者

773

483

排名 #6

2月15日

查看详情

首页上一页

下一页末页

asr - 主题项目

asr - 主题项目

每日趋势

每周趋势

每月趋势

趋势分析

asr

m-bain/whisperX

modelscope/FunASR

NVIDIA-NeMo/Speech

NVIDIA-NeMo/NeMo

alphacep/vosk-api

k2-fsa/sherpa-onnx

MahmoudAshraf97/whisper-diarization

umlx5h/LLPlayer

FluidInference/FluidAudio

handy-computer/transcribe.cpp

meizhong986/WhisperJAV

soniqo/speech-swift

amicalhq/amical

TrendForge 助手