speech
话题找到数量
SakiRinn/LiveCaptions-Translator
基于Windows LiveCaptions的轻量级强大实时音频/语音翻译工具
meizhong986/WhisperJAV
ASR/STT字幕生成器。采用Qwen3-ASR、本地LLM、Whisper、TEN-VAD技术,具备针对JAV场景的噪声鲁棒性
amicalhq/amical
🎙️ AI Dictation App - Open Source and Local-first ⚡ Type 3x faster, no keyboard needed. 🆓 Powered by open source models, works offline, fast and accurate.
rapidaai/voice-ai
Rapida是一个开源、端到端的语音AI编排平台,用于构建具备音频流、语音识别、语音合成、语音活动检测、多通道集成、智能体状态管理和可观测性的实时对话语音智能体。
Blaizzy/mlx-audio-swift
一个用于在Apple Silicon上使用MLX进行音频处理的模块化Swift SDK