❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

speech

话题找到数量

huggingface/transformers

🤗 Transformers:面向文本、视觉、音频及多模态模型的尖端机器学习模型定义框架,支持推理与训练全流程。

160k
33k
553
+50
排名 #13
5月12日
查看详情

unslothai/unsloth

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

65k
5.8k
498
+6.1k
排名 #19
5月24日
查看详情

ggml-org/whisper.cpp

OpenAI Whisper模型的C/C++移植版本

49k
5.6k
847
+1k
排名 #21
5月18日
查看详情

myshell-ai/OpenVoice

MIT与MyShell联合开发的即时语音克隆技术

36k
4.1k
220
+16
排名 #12
5月3日
查看详情

mozilla-ai/llamafile

用单个文件分发和运行大语言模型。

24k
1.3k
309
+438
排名 #6
4月30日
查看详情

cjpais/Handy

完全离线的免费开源可扩展语音转文本应用程序

22k
1.9k
368
+458
排名 #17
5月27日
查看详情

m-bain/whisperX

WhisperX:具备词级时间戳标注的自动语音识别系统

19k
2.1k
380
+17
排名 #9
2月1日
查看详情

screenpipe/screenpipe

screenpipe将您的电脑转变为个人AI助手,它能知晓您的一切操作。记录、搜索、自动化,全部本地运行,完全私密,尽在您掌控。

18k
1.8k
303
+162
排名 #17
5月24日
查看详情

OpenBMB/VoxCPM

VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统

18k
2.2k
424
+4.1k
排名 #16
5月14日
查看详情

IDEA-Research/Grounded-Segment-Anything

Grounded SAM:融合Grounding DINO与Segment Anything及Stable Diffusion与Recognize Anything——自动检测、分割并生成万物

17k
1.6k
261
+6
排名 #20
4月2日
查看详情

NVIDIA-NeMo/NeMo

专为从事大语言模型、多模态和语音人工智能(自动语音识别与文本转语音)的研究人员和开发者打造的可扩展生成式AI框架

17k
3.4k
551
+11
排名 #13
5月15日
查看详情

jianchang512/pyvideotrans

将视频从一种语言翻译为另一种语言,并嵌入配音与字幕。

16k
2k
160
+72
排名 #12
3月30日
查看详情

modelscope/FunASR

端到端语音识别基础工具包与开源SOTA预训练模型,支持语音识别、语音活动检测、文本后处理等功能。

16k
1.7k
405
+42
排名 #16
5月26日
查看详情

NVIDIA/DeepLearningExamples

按模型组织的尖端深度学习脚本——易于在企业级基础设施上进行训练和部署,并具备可复现的准确性与性能。

14k
3.4k
165
排名 #8
5月16日
查看详情

cjpais/Handy

完全离线的免费开源可扩展语音转文本应用程序

14k
974
368
+4.2k
排名 #11
2月7日
查看详情

alphacep/vosk-api

适用于Android、iOS、树莓派及服务端的离线语音识别API,支持Python、Java、C#和Node.js开发语言。

14k
1.7k
305
+2
排名 #15
3月7日
查看详情

k2-fsa/sherpa-onnx

基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。

12k
1.4k
364
+775
排名 #22
5月22日
查看详情

Zackriya-Solutions/meetily

Meetily是一款隐私优先的AI会议助手,基于Rust构建,提供比Parakeet/Whisper快4倍的实时转录、说话人分离及Ollama摘要功能。100%本地处理,无需云端。作为排名第一的自托管开源AI会议记录工具,支持macOS与Windows系统。

12k
1.2k
280
+548
排名 #15
5月25日
查看详情

rhasspy/piper

一款快速、本地的神经文本转语音系统

10k
916
309
+51
排名 #20
3月8日
查看详情

supertone-inc/supertonic

闪电般快速、设备端运行的多语言TTS——通过ONNX原生执行。

10k
1.1k
198
+4.6k
排名 #15
5月25日
查看详情

openvinotoolkit/openvino

OpenVINO™是用于优化和部署AI推理的开源工具套件

10k
3.2k
444
+207
排名 #22
5月8日
查看详情

pyannote/pyannote-audio

说话人日志神经构建模块:语音活动检测、说话人变更检测、重叠语音检测、说话人嵌入

9.9k
1.1k
331
+171
排名 #17
5月1日
查看详情

Zackriya-Solutions/meeting-minutes

一款免费开源、基于人工智能的自托管实时会议记录与纪要生成工具,可完全在本地设备运行(已支持Mac OS和Windows系统,即将新增Linux支持)https://meetily.zackriya.com/ 这就是meetly ai

9.8k
882
336
+143
排名 #19
2月15日
查看详情

espeak-ng/espeak-ng

eSpeak NG是开源语音合成器,支持上百种语言和口音

6.4k
1.2k
304
+34
排名 #21
5月11日
查看详情
助手