❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

项目介绍快速开始学习路径项目截图 1 贡献者 20 增长趋势 Commit 历史代码统计生态关系项目时间线项目竞品依赖分析上榜历史

Vaibhavs10/insanely-fast-whisper

Jupyter Notebook 低活跃

203

最后更新2026-05-04

12k

+24

956

项目介绍

暂无项目描述

智能标签

生成技术栈、用途、特征、受众等多维度标签

使用场景

使用场景自动生成

这是一个为需要本地、高速、批量音频转录的开发者设计的优化命令行工具。

批量处理长音频

开发者需要转录数小时的长音频文件（如播客、会议录音），但使用原始Whisper模型速度极慢，等待时间过长。

使用该CLI工具，通过集成Flash Attention 2、批处理和模型优化技术，能将2.5小时音频的转录时间从数十分钟缩短至约98秒。

处理一个2小时的会议录音，只需运行一条命令如 `insanely-fast-whisper --file-name meeting.wav`，即可在不到2分钟内获得完整文本转录。

本地快速字幕生成

视频创作者需要为本地视频快速生成字幕，但希望完全在本地运行以保证隐私，且对转录速度有较高要求。

该项目提供轻量级CLI，支持在本地设备（包括带GPU的机器）上运行优化后的Whisper模型，实现高速、离线的音频转录。

在配备Nvidia GPU的工作站上，为一段30分钟的视频生成字幕，通过命令指定使用Flash Attention 2的large-v3模型，可在几十秒内完成。

研究或原型快速验证

研究人员或学生在进行语音相关项目时，需要快速转录大量音频样本以验证想法，但受限于计算资源或时间。

项目支持更轻量的Distil-Whisper模型及多种优化选项（如8-bit量化），即使在Google Colab的T4 GPU等受限环境中也能实现快速转录。

在Colab笔记本中，使用 `--model distil-large-v2` 和 `--flash False` 等参数，快速转录多个短音频样本，用于训练数据预处理或模型效果测试。

终端集成自动化

开发者希望将音频转录功能无缝集成到自动化脚本或工作流中，需要一个简单、可靠且高性能的命令行工具。

该项目提供简洁的CLI接口，可通过pip安装并直接在任何路径下运行，输出结果易于被其他脚本（如字幕处理、内容分析）捕获和处理。

在媒体处理流水线中，使用 `pipx run insanely-fast-whisper --file-name input.mp3 > transcript.txt` 将转录结果直接保存，供后续分析使用。

项目健康度

53/100

一般

活跃度 2/23

距上次更新 213 天

人气 24/25

平台 Star TOP 6% · Forks 956

增长 15/25

本周 +186 ⭐ · 本月 +744 ⭐

社区 9/17

20 位贡献者 · 0 条平台评论

文档 3/10

缺少 3 项内容

2 项改进建议

活跃度：项目已超过 213 天未更新，可能处于低维护状态
文档：完善项目文档（截图、AI 分析等）可提升健康度得分

在 GitHub 上查看

项目信息

作者 Vaibhavs10

来源 GitHub

周期每日

仓库ID Vaibhavs10/insanely-fast-whisper

最新提交 2025-10-25 09:50:57

第一收录 2026-05-05 08:01:40

最后更新 2026-05-05 08:01:40

赞赏支持

如果本站对你有帮助，欢迎打赏支持

微信

支付宝

Widget 徽章

预览

Markdown

HTML

登录后发表评论

加载评论中...