#音频转录

awesome-whisper入门学习资料-OpenAI开源语音识别系统

2 个月前
Cover of awesome-whisper入门学习资料-OpenAI开源语音识别系统

faster-whisper学习资料汇总 - 快速高效的语音识别模型

2 个月前
Cover of faster-whisper学习资料汇总 - 快速高效的语音识别模型

Shush: 基于WhisperV3的高性能语音转文字应用

3 个月前
Cover of Shush: 基于WhisperV3的高性能语音转文字应用

Wordcab Transcribe: 革新语音识别的开源解决方案

3 个月前
Cover of Wordcab Transcribe: 革新语音识别的开源解决方案

Stage Whisper: 革命性的开源音频转录应用

3 个月前
Cover of Stage Whisper: 革命性的开源音频转录应用

Whisper语音转录与说话人识别技术: 实现多人对话的精准文本化

3 个月前
Cover of Whisper语音转录与说话人识别技术: 实现多人对话的精准文本化

Whisper.rn: 在React Native中集成OpenAI的Whisper语音识别模型

3 个月前
Cover of Whisper.rn: 在React Native中集成OpenAI的Whisper语音识别模型

Vibe: 开源离线语音转文字工具的新选择

3 个月前
Cover of Vibe: 开源离线语音转文字工具的新选择

OpenAI Bridge:为Blender带来人工智能的强大功能

3 个月前
Cover of OpenAI Bridge:为Blender带来人工智能的强大功能

OpenAI Whisper: 开源语音识别的革命性突破

3 个月前
Cover of OpenAI Whisper: 开源语音识别的革命性突破
相关项目
Project Cover

faster-whisper

faster-whisper是对OpenAI的Whisper模型的重新实现,基于CTranslate2,这是一个针对Transformer模型的高速推理引擎。该实现在保持相同准确率的前提下,速度比openai/whisper快4倍,内存使用也更少。另外,通过在CPU和GPU上使用8位量化,可以进一步提高效率。该项目适用于需要快速、高效语音转写的场景,特别是处理大量语音数据时的实时应用。

Project Cover

awesome-whisper

Whisper是OpenAI开发的开源AI语音识别系统,支持多种语言和平台,具备高精度和实时处理能力,并适用于开发者和企业进行高效集成。

Project Cover

vibe

Vibe利用开源工具OpenAI Whisper进行离线音视频转录,支持几乎所有语言,保证数据隐私。软件界面友好,支持多种文件格式如SRT、VTT、TXT、HTML、PDF和JSON。Vibe还具备批量转录、多语言翻译和实时预览等功能,适用于Windows、Linux和macOS系统。优化了对CPU和GPU的支持,兼容Nvidia和AMD GPU。用户可以通过命令行接口进行操作,并提供HTTP API文档。其他功能包括系统音频转录、麦克风转录、说话人分割,未来还将支持iOS和Android。

Project Cover

OpenAI-Bridge

OpenAI-Bridge是一款Blender插件,帮助用户在Blender中集成OpenAI API功能,包括图像生成与编辑、音频转录、聊天、以及Blender Python代码生成与编辑。支持的模型有DALL-E, whisper-1, gpt-3.5-turbo, gpt-4和gpt-4-32k。用户可以通过插件文档获取安装指南、使用教程和最新更新,并通过GitHub报告问题、请求新功能和参与讨论。

Project Cover

whisper-clip

WhisperClip是一款自动转录音频并将文本直接保存至剪贴板的工具。只需点击按钮即可将口语转换为书面文本。应用支持Python 3.8及以上版本,使用OpenAI的Whisper技术,无论GPU还是CPU都能选择合适的模型以确保最佳性能。用户可以提供反馈并参与改进项目。

Project Cover

whisper.rn

whisper.rn是React Native环境中OpenAI的Whisper自动语音识别模型的高性能实现,支持iOS和Android平台,具备实时转录功能,并集成Core ML和NDK优化。项目提供详细的安装与使用指南及实用技巧,适合在移动应用中集成语音识别功能。

Project Cover

Whisper-transcription_and_diarization-speaker-identification-

本教程详细介绍如何使用OpenAI Whisper进行音频转录和说话人识别,并结合pyannote-audio进行对话分析。学习如何准备音频、区分说话人,并将结果与转录文本匹配,实现智能音频分析。

Project Cover

Stage-Whisper

Stage Whisper是一款免费开源的音频转录应用,基于OpenAI的Whisper模型,提供精确的音频文件转录。它拥有直观的图形界面,用户可以轻松存储和编辑转录内容。该项目旨在让非技术用户也能方便地使用Whisper的强大功能。适用于MacOS、Windows和Linux多平台,目前正进行重大改进,测试版即将发布。

Project Cover

buzz

Buzz是一款运行于个人电脑上的离线音频转录与翻译工具,使用OpenAI的Whisper技术,能够高效地转录并翻译音频内容。该应用提供Mac App Store专用版本,具有更清晰的界面和更丰富的功能,如音频回放、拖放导入、转录编辑和搜索等。对于不同操作系统,Buzz提供了简便的安装方式,包括Windows, macOS和Linux。Buzz旨在提供无缝和高效的用户体验,以满足广泛的个人和专业需要。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号