❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

speech-to-text

话题找到数量

ggml-org/whisper.cpp

OpenAI Whisper模型的C/C++移植版本

49k
5.6k
837
+1k
排名 #21
5月18日
查看详情

mozilla-ai/llamafile

用单个文件分发和运行大语言模型。

24k
1.3k
296
+438
排名 #6
4月30日
查看详情

cjpais/Handy

完全离线的免费开源可扩展语音转文本应用程序

21k
1.7k
363
+458
排名 #17
5月3日
查看详情

m-bain/whisperX

WhisperX:具备词级时间戳标注的自动语音识别系统

19k
2.1k
371
+17
排名 #9
2月1日
查看详情

screenpipe/screenpipe

screenpipe将您的电脑转变为个人AI助手,它能知晓您的一切操作。记录、搜索、自动化,全部本地运行,完全私密,尽在您掌控。

18k
1.8k
303
+162
排名 #17
5月24日
查看详情

jianchang512/pyvideotrans

将视频从一种语言翻译为另一种语言,并嵌入配音与字幕。

16k
2k
159
+72
排名 #12
3月30日
查看详情

modelscope/FunASR

端到端语音识别基础工具包与开源SOTA预训练模型,支持语音识别、语音活动检测、文本后处理等功能。

16k
1.7k
391
+42
排名 #16
5月26日
查看详情

cjpais/Handy

完全离线的免费开源可扩展语音转文本应用程序

14k
974
363
+4.2k
排名 #11
2月7日
查看详情

alphacep/vosk-api

适用于Android、iOS、树莓派及服务端的离线语音识别API,支持Python、Java、C#和Node.js开发语言。

14k
1.7k
292
+2
排名 #15
3月7日
查看详情

k2-fsa/sherpa-onnx

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。

12k
1.4k
363
+775
排名 #22
5月22日
查看详情

Zackriya-Solutions/meetily

Meetily是一款隐私优先的AI会议助手,基于Rust构建,提供比Parakeet/Whisper快4倍的实时转录、说话人分离及Ollama摘要功能。100%本地处理,无需云端。作为排名第一的自托管开源AI会议记录工具,支持macOS与Windows系统。

12k
1.2k
278
+548
排名 #15
5月25日
查看详情

Zackriya-Solutions/meeting-minutes

一款免费开源、基于人工智能的自托管实时会议记录与纪要生成工具,可完全在本地设备运行(已支持Mac OS和Windows系统,即将新增Linux支持)https://meetily.zackriya.com/ 这就是meetly ai

9.8k
882
334
+143
排名 #19
2月15日
查看详情

Blaizzy/mlx-audio

一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库,可在Apple Silicon芯片上实现高效语音分析。

6.3k
493
359
+2k
排名 #13
3月15日
查看详情

argmaxinc/argmax-oss-swift

面向苹果芯片的端侧语音人工智能

6.1k
565
121
+58
排名 #16
5月24日
查看详情

MahmoudAshraf97/whisper-diarization

基于OpenAI Whisper的说话人日志自动语音识别系统

5.4k
500
221
+4
排名 #16
3月18日
查看详情

huggingface/speech-to-speech

语音转语音:致力于构建开源模块化GPT4-o的项目

4.4k
500
274
+35
排名 #15
2月8日
查看详情

dograh-hq/dograh

开源语音代理平台

3.3k
707
115
+1.1k
排名 #17
5月26日
查看详情

SakiRinn/LiveCaptions-Translator

基于Windows LiveCaptions的轻量级强大实时音频/语音翻译工具

3k
210
299
+378
排名 #22
5月24日
查看详情

pluja/whishper

通过网页界面100%本地化地将任意音频转录为文本,翻译并编辑字幕。由whisper模型驱动!

3k
172
332
+48
排名 #18
3月31日
查看详情

Light-Heart-Labs/DreamServer

随处可用的本地AI,人人皆可——涵盖LLM推理、聊天界面、语音、智能体、工作流、RAG及图像生成。无需云端,无需订阅。

1.7k
265
116
+571
排名 #4
5月24日
查看详情

Light-Heart-Labs/DreamServer

随处可用的本地AI,人人皆可——涵盖LLM推理、聊天界面、语音、智能体、工作流、RAG及图像生成。无需云端,无需订阅。

1.5k
223
116
+458
排名 #12
5月18日
查看详情

meizhong986/WhisperJAV

ASR/STT字幕生成器。采用Qwen3-ASR、本地LLM、Whisper、TEN-VAD技术,具备针对JAV场景的噪声鲁棒性

1.2k
112
243
+103
排名 #7
3月15日
查看详情

amicalhq/amical

🎙️ AI Dictation App - Open Source and Local-first ⚡ Type 3x faster, no keyboard needed. 🆓 Powered by open source models, works offline, fast and accurate.

773
74
281
+8
排名 #6
2月15日
查看详情

rapidaai/voice-ai

Rapida是一个开源、端到端的语音AI编排平台,用于构建具备音频流、语音识别、语音合成、语音活动检测、多通道集成、智能体状态管理和可观测性的实时对话语音智能体。

710
204
297
+13
排名 #16
4月9日
查看详情
助手