❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️
项目竞品项目
m-bain/whisperX
WhisperX:具备词级时间戳标注的自动语音识别系统
MahmoudAshraf97/whisper-diarization
基于OpenAI Whisper的说话人日志自动语音识别系统
huggingface/transformers
🤗 Transformers:面向文本、视觉、音频及多模态模型的尖端机器学习模型定义框架,支持推理与训练全流程。
Blaizzy/mlx-audio
一个基于苹果MLX框架构建的文本转语音、语音转文本及语音转语音库,可在Apple Silicon芯片上实现高效语音分析。
argmaxinc/argmax-oss-swift
面向苹果芯片的端侧语音人工智能
pluja/whishper
通过网页界面100%本地化地将任意音频转录为文本,翻译并编辑字幕。由whisper模型驱动!
pyannote/pyannote-audio
说话人日志神经构建模块:语音活动检测、说话人变更检测、重叠语音检测、说话人嵌入
alphacep/vosk-api
适用于Android、iOS、树莓派及服务端的离线语音识别API,支持Python、Java、C#和Node.js开发语言。
ggml-org/whisper.cpp
OpenAI Whisper模型的C/C++移植版本
Zackriya-Solutions/meetily
Meetily是一款隐私优先的AI会议助手,基于Rust构建,提供比Parakeet/Whisper快4倍的实时转录、说话人分离及Ollama摘要功能。100%本地处理,无需云端。作为排名第一的自托管开源AI会议记录工具,支持macOS与Windows系统。
Zackriya-Solutions/meeting-minutes
一款免费开源、基于人工智能的自托管实时会议记录与纪要生成工具,可完全在本地设备运行(已支持Mac OS和Windows系统,即将新增Linux支持)https://meetily.zackriya.com/ 这就是meetly ai
SakiRinn/LiveCaptions-Translator
基于Windows LiveCaptions的轻量级强大实时音频/语音翻译工具
Anjok07/ultimatevocalremovergui
基于深度神经网络的人声分离图形界面工具。
OpenBMB/VoxCPM
VoxCPM:面向上下文感知语音生成与逼真音色克隆的无分词器文本转语音系统
NVIDIA/DeepLearningExamples
按模型组织的尖端深度学习脚本——易于在企业级基础设施上进行训练和部署,并具备可复现的准确性与性能。
LMCache/LMCache
通过最快的KV缓存层为您的LLM加速
k2-fsa/sherpa-onnx
基于新一代Kaldi与onnxruntime的离线语音转文字、文字转语音、说话人日志、语音增强、源分离及语音活动检测技术。支持嵌入式系统、Android、iOS、HarmonyOS、树莓派、RISC-V架构、x86_64服务器、WebSocket服务端/客户端,兼容12种编程语言。
meta-llama/llama-cookbook
欢迎来到Llama实践指南!这是您使用Llama进行开发的必备指南:涵盖推理入门、微调及RAG技术。我们还将展示如何利用Llama模型家族解决端到端问题,并在不同云服务平台上进行部署
kserve/kserve
面向 Kubernetes 可扩展多框架部署的标准化分布式生成式与预测式 AI 推理平台
相关项目推荐
public-apis/public-apis
免费API资源汇总列表
EbookFoundation/free-programming-books
📚 免费提供的编程书籍
donnemartin/system-design-primer
学习如何设计大规模系统。为系统设计面试做准备。包含Anki记忆卡片。
vinta/awesome-python
精心整理的优质Python框架、库、软件及资源列表
TheAlgorithms/Python
所有算法均使用Python实现
Significant-Gravitas/AutoGPT
AutoGPT致力于实现人人可用的普惠AI,让每个人都能使用和构建AI。我们的使命是提供工具,让您专注于重要事务。