audio
话题找到数量
huggingface/transformers
🤗 Transformers:面向文本、视觉、音频及多模态模型的尖端机器学习模型定义框架,支持推理与训练全流程。
156k
32k
344
+50
mudler/LocalAI
🤖 开源免费的OpenAI、Claude及其他AI平台的替代方案。支持自主托管且本地优先,可作为OpenAI的即插即用替代方案运行于消费级硬件,无需GPU。兼容gguf、transformers、diffusers等多种模型架构。功能包括:文本生成、音频处理、视频制作、图像生成、语音克隆、分布式点对点推理。
44k
3.9k
229
+593
ossrs/srs
SRS是一款简单高效的实时媒体服务器,支持RTMP、WebRTC、HLS、HTTP-FLV、HTTP-TS、SRT、MPEG-DASH和GB28181协议。
28k
5.7k
208
+63
modelscope/FunASR
端到端语音识别基础工具包与开源SOTA预训练模型,支持语音识别、语音活动检测、文本后处理等功能。
15k
1.6k
172
+11