tts - 主题项目

追踪 GitHub 趋势，把握技术发展脉搏

探索趋势了解更多

tts - 主题项目

追踪 GitHub 趋势，把握技术发展脉搏

探索趋势了解更多

成就解锁

❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

tts

话题找到数量

unslothai/unsloth

大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3，节省70%显存

agent deepseek fine-tuning

unslothai

unslothai 开发者

66k

6k

606

+6.1k

排名 #19

6月20日

CorentinJ/Real-Time-Voice-Cloning

5秒克隆声音，实时生成任意语音

deep-learning python pytorch

CorentinJ

CorentinJ 开发者

59k

9.4k

475

+19

排名 #11

3月3日

mudler/LocalAI

🤖 开源免费的OpenAI、Claude及其他AI平台的替代方案。支持自主托管且本地优先，可作为OpenAI的即插即用替代方案运行于消费级硬件，无需GPU。兼容gguf、transformers、diffusers等多种模型架构。功能包括：文本生成、音频处理、视频制作、图像生成、语音克隆、分布式点对点推理。

ai api audio-generation

mudler

mudler 开发者

47k

4.2k

589

+593

排名 #18

7月7日

jamiepine/voicebox

开源语音合成工作室

ai cuda mlx

jamiepine

jamiepine 开发者

40k

4.9k

350

+5.7k

排名 #15

7月12日

myshell-ai/OpenVoice

MIT与MyShell联合开发的即时语音克隆技术

text-to-speech tts voice-clone

myshell-ai

myshell-ai 开发者

36k

4.1k

339

+16

排名 #12

5月3日

OpenBMB/VoxCPM

VoxCPM：面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统

audio deeplearning minicpm

OpenBMB

OpenBMB 开发者

30k

3.4k

547

+4.3k

排名 #17

6月17日

fishaudio/fish-speech

顶尖开源文本转语音系统

llama transformer tts

fishaudio

fishaudio 开发者

30k

2.6k

421

+4k

排名 #14

5月12日

ATH-MaaS/Pixelle-Video

🚀 AI 全自动短视频引擎 | AI Fully Automated Short Video Engine

aigc comfyui image-generation

ATH-MaaS

ATH-MaaS 开发者

25k

3.6k

57

+115

排名 #18

7月11日

mastra-ai/mastra

TypeScript AI智能体框架 ⚡ 支持助手、RAG和可观测性。兼容所有大语言模型：GPT-4、Claude、Gemini、Llama

agents ai chatbots

mastra-ai

mastra-ai 开发者

24k

2.1k

684

+309

排名 #15

5月28日

AIDC-AI/Pixelle-Video

🚀 AI全自动短视频引擎

aigc comfyui image-generation

AIDC-AI

AIDC-AI 开发者

21k

3k

643

+12k

排名 #15

6月4日

DrewThomasson/ebook2audiobook

从电子书生成有声书，支持语音克隆及1107种以上语言！

audiobook audiobooks chinese

DrewThomasson

DrewThomasson 开发者

19k

1.6k

482

+622

排名 #21

6月12日

pot-app/pot-desktop

🌈 一款跨平台的划词翻译与OCR软件

linux macos ocr

pot-app

pot-app 开发者

18k

929

363

+36

排名 #14

6月26日

readest/readest

Readest是一款功能丰富的现代电子书阅读器，专为热爱阅读的用户设计，提供无缝跨平台访问、强大工具和直观界面，以提升您的阅读体验。

android cross-platform ebook

readest

readest 开发者

18k

976

395

+494

排名 #15

2月23日

NVIDIA-NeMo/Speech

一个可扩展的生成式 AI 框架，专为从事大语言模型、多模态及语音 AI（自动语音识别与文本转语音）的研究人员和开发者构建。

asr deeplearning generative-ai

NVIDIA-NeMo

NVIDIA-NeMo 开发者

17k

3.5k

221

+12

排名 #11

6月25日

NVIDIA-NeMo/NeMo

专为从事大语言模型、多模态和语音人工智能（自动语音识别与文本转语音）的研究人员和开发者打造的可扩展生成式AI框架

asr deeplearning generative-ai

NVIDIA-NeMo

NVIDIA-NeMo 开发者

17k

3.4k

752

+11

排名 #22

6月12日

supertone-inc/supertonic

闪电般快速、设备端运行的多语言TTS——通过ONNX原生执行。

cpp csharp go

supertone-inc

supertone-inc 开发者

12k

1.3k

406

+8.2k

排名 #15

7月9日

rhasspy/piper

一款快速、本地的神经文本转语音系统

speech-synthesis text-to-speech tts

rhasspy

rhasspy 开发者

10k

916

436

+51

排名 #20

3月8日

krillinai/KrillinAI

基于大语言模型的视频翻译配音工具，支持99种语言双向翻译，提供一键式全流程部署，可生成适配YouTube、TikTok和Shorts等平台的内容

dubbing localization tts

krillinai

krillinai 开发者

10k

965

533

+194

排名 #17

6月20日

VoltAgent/voltagent

基于开源TypeScript AI智能体框架构建的AI智能体工程平台

agents ai ai-agents

VoltAgent

VoltAgent 开发者

8.8k

891

329

+111

排名 #10

5月12日

moonshine-ai/moonshine

面向边缘设备的快速准确自动语音识别

intent-recognition stt tts

moonshine-ai

moonshine-ai 开发者

8.2k

431

574

+133

排名 #16

5月24日

santinic/audiblez

将电子书转换为有声读物

audiobooks epub kokoro

santinic

santinic 开发者

7.8k

672

272

+139

排名 #17

6月20日

GetStream/Vision-Agents

Stream 推出的开放视觉智能体平台。使用任意模型或视频提供商快速构建视觉智能体。利用 Stream 的边缘网络实现超低延迟。

agentic-ai agents ai

GetStream

GetStream 开发者

7.1k

536

429

+953

排名 #13

3月1日

argmaxinc/argmax-oss-swift

面向苹果芯片的端侧语音人工智能

inference ios macos

argmaxinc

argmaxinc 开发者

6.3k

584

277

+58

排名 #16

7月13日

jing332/tts-server-android

这是一款安卓系统TTS应用，集成微软演示接口，支持自定义HTTP请求，可加载外部本地TTS引擎，具备中文双引号旁白对话识别功能，并包含自动重试、备用配置、文本替换等特性。

android compose-ui golang

jing332

jing332 开发者

4.4k

403

168

+2

排名 #17

6月8日

首页上一页

1 2

1 2

下一页末页

助手