insanely-fast-whisper-api - 音频转文字的高速开源API，支持GPU云部署与并发处理

项目介绍：Insanely Fast Whisper API

Insanely Fast Whisper API 是一个音频转文本服务的接口，利用 OpenAI 的 Whisper Large v3 模型进行高效的音频转录。该项目背后使用的是 🤗 Transformers、Optimum 和 flash-attn 技术，以确保快速处理和高性能表现。

该项目基于 Insanely Fast Whisper CLI 项目，旨在通过 Docker 在云基础设施（尤其是在支持 GPU 的服务上）上提供可部署的转录 API。用户可以选择在 Fly.io 上进行部署，该平台近日刚推出了 GPU 相关服务，配置文件的设置使得部署变得极为简单。

经过在 Nvidia A100 - 80GB 和 Fly.io 的 GPU 基础设施上的一系列性能测试，该服务在优化条件下，能够在大约2分钟内处理150分钟的音频内容。

用户可以通过 Docker Hub 获取最新的镜像使用：

yoeven/insanely-fast-whisper-api:latest

初始部署可能会因为镜像较大而耗时较长，但之后的更新会更快。可以通过设置环境变量来配置发言者区分或 API 安全认证。

由于项目是 Docker 化应用，只需对配置进行少量调整即可在任何支持 Docker 和 GPU 的云服务上部署。

设置 ADMIN_KEY 之后，需要在请求头中使用 x-admin-api-key 进行身份认证。

可以在本地克隆代码库并按照指引配置 Python 环境，运行为局域网提供服务。

项目还支持程序化关闭 Fly 机器，以节省云资源费用。当 API 不再需要使用时，可以通过发出一个 POST 请求来关闭机器。

感谢 Vaibhav Srivastav 编写了项目代码的大部分及 CLI 版本，并感谢 OpenAI 提供的 Whisper 模型。

这是 JigsawStack 项目集的一部分，致力于提供高性价比的强大 API 服务。用户可免费注册使用。