whisper - 跨平台音频转文本开源项目

简介

Whisper是一个由OpenAI开发的开源库，其主要功能是将音频转换为文本，简单来说，就是帮助我们从音频内容中提取文字。这项技术在很多领域都有广泛应用，比如语音识别、字幕生成等。

Whisper项目目前支持多个平台，虽然并不是所有的平台都已实现，但它已经可以在Linux、Android和CLI等平台上运行。尚未支持的平台包括Windows、macOS、Web和iOS。

Whisper的目标是实现实时转录功能，目前暂未完全实现。最终版本将能够在多个平台上进行实时的语音转录，包括Android、Linux、macOS和CLI等。

Whisper将来还计划支持自动转录各种类型的音频和视频，不需要手动转换为特定的格式如wav。目前，这依然在开发中。

为了验证Whisper的功能，项目在多种设备上进行了测试，包括：

由于目前的开发设备有限，项目希望得到经济上的支持，以便能够在更多的设备和平台上进行开发测试。任何捐赠都将用于购买新设备，以加速软件的开发进度。

Whisper的代码此前版本存在混乱，所以项目负责人决定重写代码，以确保软件能够在多个平台上顺利运行，并支持来自于Whisper.cpp的最新功能。

Whisper主要依赖以下几个方面的技术实现：

大多数类似的开源项目只是专注于某一特定平台，而Whisper的目标是跨平台支持。通过捐赠或关注项目社交媒体，您可以助力更快推出更新版本和增加平台支持。

虽然Whisper已经支持跨平台功能，但目前还没有在pub.dev上发布Dart相关的标签。开发团队在库中已添加Flutter支持，用户只需根据不同的平台调整导入部分即可。

项目遵循Apache License 2.0协议，用户可以在一定条件下自由使用和修改代码，但请务必注明原作者及项目的链接。