MahmoudAshraf97/whisper-diarization - 竞品分析

Swift speaker-diarization speech-recognition speech-to-text whisper

6.2k 570

面向苹果芯片的端侧语音人工智能

55%

+58

m-bain/whisperX

Python asr speech speech-recognition speech-to-text whisper

19.9k 2.1k

WhisperX：具备词级时间戳标注的自动语音识别系统

54%

+17

alphacep/vosk-api

Jupyter Notebook asr speech-recognition speech-to-text

14.8k 1.7k

适用于Android、iOS、树莓派及服务端的离线语音识别API，支持Python、Java、C#和Node.js开发语言。

52%

ggml-org/whisper.cpp

C++ speech-recognition speech-to-text whisper

50.3k 5.6k

OpenAI Whisper模型的C/C++移植版本

41%

+1.0k

modelscope/FunASR

Python speaker-diarization speech-recognition whisper

17.4k 1.8k

端到端语音识别基础工具包与开源SOTA预训练模型，支持语音识别、语音活动检测、文本后处理等功能。

41%

+705

pluja/whishper

Svelte speech-recognition speech-to-text whisper

3.0k 172

通过网页界面100%本地化地将任意音频转录为文本，翻译并编辑字幕。由whisper模型驱动！

41%

+48

soniqo/speech-swift

Swift asr speaker-diarization speech-recognition

772 103

面向 Apple Silicon 的 AI 语音工具包 — 基于 MLX 和 CoreML 的 ASR、TTS、语音到语音、VAD 及说话人分离功能。

35%

Blaizzy/mlx-audio

Python speech-recognition speech-to-text

6.3k 493

一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库，可在Apple Silicon芯片上实现高效语音分析。

30%

+2.0k

amicalhq/amical

TypeScript asr speech-to-text whisper

773 74

🎙️ AI Dictation App - Open Source and Local-first ⚡ Type 3x faster, no keyboard needed. 🆓 Powered by open source models, works offline, fast and accurate.

30%

Zackriya-Solutions/meetily

Rust speech-to-text whisper

12.4k 1.3k

Meetily是一款隐私优先的AI会议助手，基于Rust构建，提供比Parakeet/Whisper快4倍的实时转录、说话人分离及Ollama摘要功能。100%本地处理，无需云端。作为排名第一的自托管开源AI会议记录工具，支持macOS与Windows系统。

+969

Zackriya-Solutions/meeting-minutes

Rust speech-to-text whisper

9.8k 882

一款免费开源、基于人工智能的自托管实时会议记录与纪要生成工具，可完全在本地设备运行（已支持Mac OS和Windows系统，即将新增Linux支持）https://meetily.zackriya.com/ 这就是meetly ai

+143

argmaxinc/WhisperKit

Swift speech-recognition whisper

6.0k 541

适用于Apple Silicon设备的本地语音识别

+202

microsoft/Foundry-Local

C++ speech-to-text whisper

2.3k 322

项目竞品项目否描述

+35

meizhong986/WhisperJAV

HTML speech-to-text whisper

1.2k 112

ASR/STT字幕生成器。采用Qwen3-ASR、本地LLM、Whisper、TEN-VAD技术，具备针对JAV场景的噪声鲁棒性

+103

huggingface/speech-to-speech

Python speech speech-to-text

4.4k 500

语音转语音：致力于构建开源模块化GPT4-o的项目

24%

+35

k2-fsa/sherpa-onnx

12.9k 1.5k

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端，兼容12种编程语言。

C++ asr speech-to-text

20%

+775

cactus-compute/cactus

5.3k 420

在手机、可穿戴设备及AI原生硬件上本地运行人工智能

umlx5h/LLPlayer