tts

话题找到数量

unslothai/unsloth

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存

60k
5.2k
301
+6.1k
排名 #19
4月8日
查看详情

CorentinJ/Real-Time-Voice-Cloning

5秒克隆声音,实时生成任意语音

59k
9.4k
159
+19
排名 #11
3月3日
查看详情

mudler/LocalAI

🤖 开源免费的OpenAI、Claude及其他AI平台的替代方案。支持自主托管且本地优先,可作为OpenAI的即插即用替代方案运行于消费级硬件,无需GPU。兼容gguf、transformers、diffusers等多种模型架构。功能包括:文本生成、音频处理、视频制作、图像生成、语音克隆、分布式点对点推理。

44k
3.9k
229
+593
排名 #16
4月5日
查看详情

fishaudio/fish-speech

顶尖开源文本转语音系统

28k
2.4k
170
+4k
排名 #14
3月31日
查看详情

mastra-ai/mastra

TypeScript AI智能体框架 ⚡ 支持助手、RAG和可观测性。兼容所有大语言模型:GPT-4、Claude、Gemini、Llama

21k
1.5k
255
+309
排名 #15
2月12日
查看详情

DrewThomasson/ebook2audiobook

从电子书生成有声书,支持语音克隆及1107种以上语言!

18k
1.5k
198
+622
排名 #13
2月15日
查看详情

readest/readest

Readest是一款功能丰富的现代电子书阅读器,专为热爱阅读的用户设计,提供无缝跨平台访问、强大工具和直观界面,以提升您的阅读体验。

18k
976
172
+494
排名 #15
2月23日
查看详情

NVIDIA-NeMo/NeMo

专为从事大语言模型、多模态和语音人工智能(自动语音识别与文本转语音)的研究人员和开发者打造的可扩展生成式AI框架

16k
3.3k
285
+11
排名 #7
2月19日
查看详情

rhasspy/piper

一款快速、本地的神经文本转语音系统

10k
916
173
+51
排名 #20
3月8日
查看详情

krillinai/KrillinAI

基于大语言模型的视频翻译配音工具,支持99种语言双向翻译,提供一键式全流程部署,可生成适配YouTube、TikTok和Shorts等平台的内容

9.8k
860
153
+194
排名 #17
4月2日
查看详情

VoltAgent/voltagent

基于开源TypeScript AI智能体框架构建的AI智能体工程平台

7.7k
759
39
+111
排名 #7
4月9日
查看详情

OpenBMB/VoxCPM

VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统

7.6k
907
227
+1.5k
排名 #11
4月9日
查看详情

GetStream/Vision-Agents

Stream 推出的开放视觉智能体平台。使用任意模型或视频提供商快速构建视觉智能体。利用 Stream 的边缘网络实现超低延迟。

7.1k
536
182
+953
排名 #13
3月1日
查看详情

AIDC-AI/Pixelle-Video

🚀 AI全自动短视频引擎

2.9k
482
134
+160
排名 #14
3月7日
查看详情

Blaizzy/mlx-audio-swift

一个用于在Apple Silicon上使用MLX进行音频处理的模块化Swift SDK

534
72
139
+161
排名 #16
4月5日
查看详情
助手