#音频转录

awesome-whisper入门学习资料-OpenAI开源语音识别系统

2 个月前

Whisper 语音识别 OpenAI 音频转录 AI Github 开源项目

2 个月前

faster-whisper学习资料汇总 - 快速高效的语音识别模型

2 个月前

faster-whisper CTranslate2 音频转录 OpenAI Whisper模型性能比较 Github 开源项目热门

2 个月前

Shush: 基于WhisperV3的高性能语音转文字应用

3 个月前

Shush WhisperV3 Modal NextJS 音频转录 Github 开源项目

3 个月前

Wordcab Transcribe: 革新语音识别的开源解决方案

3 个月前

Wordcab Transcribe 语音识别 API 音频转录 faster-whisper Github 开源项目

3 个月前

Stage Whisper: 革命性的开源音频转录应用

3 个月前

Stage-Whisper 音频转录 Whisper 开源应用程序 Github 开源项目

3 个月前

Whisper语音转录与说话人识别技术: 实现多人对话的精准文本化

3 个月前

Whisper OpenAI diarization 音频转录人工智能 Github 开源项目

3 个月前

Whisper.rn: 在React Native中集成OpenAI的Whisper语音识别模型

3 个月前

whisper.rn 自动语音识别 React Native 音频转录 whisper.cpp Github 开源项目

3 个月前

Vibe: 开源离线语音转文字工具的新选择

3 个月前

Vibe OpenAI Whisper 音频转录隐私批量转录 Github 开源项目

3 个月前

OpenAI Bridge：为Blender带来人工智能的强大功能

3 个月前

Blender OpenAI 插件图像生成音频转录 Github 开源项目

3 个月前

OpenAI Whisper: 开源语音识别的革命性突破

3 个月前

Whisper 语音识别 OpenAI 音频转录 AI Github 开源项目

3 个月前

相关项目

faster-whisper

faster-whisper是对OpenAI的Whisper模型的重新实现，基于CTranslate2，这是一个针对Transformer模型的高速推理引擎。该实现在保持相同准确率的前提下，速度比openai/whisper快4倍，内存使用也更少。另外，通过在CPU和GPU上使用8位量化，可以进一步提高效率。该项目适用于需要快速、高效语音转写的场景，特别是处理大量语音数据时的实时应用。

awesome-whisper

Whisper是OpenAI开发的开源AI语音识别系统，支持多种语言和平台，具备高精度和实时处理能力，并适用于开发者和企业进行高效集成。

vibe

Vibe利用开源工具OpenAI Whisper进行离线音视频转录，支持几乎所有语言，保证数据隐私。软件界面友好，支持多种文件格式如SRT、VTT、TXT、HTML、PDF和JSON。Vibe还具备批量转录、多语言翻译和实时预览等功能，适用于Windows、Linux和macOS系统。优化了对CPU和GPU的支持，兼容Nvidia和AMD GPU。用户可以通过命令行接口进行操作，并提供HTTP API文档。其他功能包括系统音频转录、麦克风转录、说话人分割，未来还将支持iOS和Android。

OpenAI-Bridge

OpenAI-Bridge是一款Blender插件，帮助用户在Blender中集成OpenAI API功能，包括图像生成与编辑、音频转录、聊天、以及Blender Python代码生成与编辑。支持的模型有DALL-E, whisper-1, gpt-3.5-turbo, gpt-4和gpt-4-32k。用户可以通过插件文档获取安装指南、使用教程和最新更新，并通过GitHub报告问题、请求新功能和参与讨论。

whisper-clip

WhisperClip是一款自动转录音频并将文本直接保存至剪贴板的工具。只需点击按钮即可将口语转换为书面文本。应用支持Python 3.8及以上版本，使用OpenAI的Whisper技术，无论GPU还是CPU都能选择合适的模型以确保最佳性能。用户可以提供反馈并参与改进项目。

whisper.rn

whisper.rn是React Native环境中OpenAI的Whisper自动语音识别模型的高性能实现，支持iOS和Android平台，具备实时转录功能，并集成Core ML和NDK优化。项目提供详细的安装与使用指南及实用技巧，适合在移动应用中集成语音识别功能。

Whisper-transcription_and_diarization-speaker-identification-

本教程详细介绍如何使用OpenAI Whisper进行音频转录和说话人识别，并结合pyannote-audio进行对话分析。学习如何准备音频、区分说话人，并将结果与转录文本匹配，实现智能音频分析。

Stage-Whisper

Stage Whisper是一款免费开源的音频转录应用，基于OpenAI的Whisper模型，提供精确的音频文件转录。它拥有直观的图形界面，用户可以轻松存储和编辑转录内容。该项目旨在让非技术用户也能方便地使用Whisper的强大功能。适用于MacOS、Windows和Linux多平台，目前正进行重大改进，测试版即将发布。

buzz

Buzz是一款运行于个人电脑上的离线音频转录与翻译工具，使用OpenAI的Whisper技术，能够高效地转录并翻译音频内容。该应用提供Mac App Store专用版本，具有更清晰的界面和更丰富的功能，如音频回放、拖放导入、转录编辑和搜索等。对于不同操作系统，Buzz提供了简便的安装方式，包括Windows, macOS和Linux。Buzz旨在提供无缝和高效的用户体验，以满足广泛的个人和专业需要。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com