项目竞品项目
rapidaai/voice-ai
Rapida是一个开源、端到端的语音AI编排平台,用于构建具备音频流、语音识别、语音合成、语音活动检测、多通道集成、智能体状态管理和可观测性的实时对话语音智能体。
Blaizzy/mlx-audio
一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库,可在Apple Silicon芯片上实现高效语音分析。
pluja/whishper
通过网页界面100%本地化地将任意音频转录为文本,翻译并编辑字幕。由whisper模型驱动!
rhasspy/piper
一款快速、本地的神经文本转语音系统
OpenBMB/VoxCPM
VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统
jianchang512/pyvideotrans
将视频从一种语言翻译为另一种语言,并嵌入配音与字幕。
k2-fsa/sherpa-onnx
基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。
unslothai/unsloth
大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存
alphacep/vosk-api
适用于Android、iOS、树莓派及服务端的离线语音识别API,支持Python、Java、C#和Node.js开发语言。
GetStream/Vision-Agents
Stream 推出的开放视觉智能体平台。使用任意模型或视频提供商快速构建视觉智能体。利用 Stream 的边缘网络实现超低延迟。
相关项目推荐
jaywcjlove/awesome-mac
如今我们已发展壮大,与最初理念有所不同。汇集各类精品软件。
swiftlang/swift
Swift编程语言
vsouza/awesome-ios
精选的优质 iOS 生态系统列表,包含 Objective-C 和 Swift 项目
iina/iina
适用于 macOS 的现代视频播放器。
Alamofire/Alamofire
Swift 中的优雅 HTTP 网络框架
exelban/stats
菜单栏内的 macOS 系统监视器