#音频转录

Buzz是一款运行于个人电脑上的离线音频转录与翻译工具，使用OpenAI的Whisper技术，能够高效地转录并翻译音频内容。该应用提供Mac App Store专用版本，具有更清晰的界面和更丰富的功能，如音频回放、拖放导入、转录编辑和搜索等。对于不同操作系统，Buzz提供了简便的安装方式，包括Windows, macOS和Linux。Buzz旨在提供无缝和高效的用户体验，以满足广泛的个人和专业需要。

faster-whisper - 基于CTranslate2对OpenAI的Whisper模型的重新实现

faster-whisperCTranslate2音频转录OpenAI Whisper模型性能比较Github开源项目热门

faster-whisper是对OpenAI的Whisper模型的重新实现，基于CTranslate2，这是一个针对Transformer模型的高速推理引擎。该实现在保持相同准确率的前提下，速度比openai/whisper快4倍，内存使用也更少。另外，通过在CPU和GPU上使用8位量化，可以进一步提高效率。该项目适用于需要快速、高效语音转写的场景，特别是处理大量语音数据时的实时应用。

awesome-whisper - 开源AI语音识别技术

Whisper语音识别OpenAI音频转录AIGithub开源项目

Whisper是OpenAI开发的开源AI语音识别系统，支持多种语言和平台，具备高精度和实时处理能力，并适用于开发者和企业进行高效集成。

vibe - 离线音视频转录，多语言支持和多格式输出

VibeOpenAI Whisper音频转录隐私批量转录Github开源项目

Vibe利用开源工具OpenAI Whisper进行离线音视频转录，支持几乎所有语言，保证数据隐私。软件界面友好，支持多种文件格式如SRT、VTT、TXT、HTML、PDF和JSON。Vibe还具备批量转录、多语言翻译和实时预览等功能，适用于Windows、Linux和macOS系统。优化了对CPU和GPU的支持，兼容Nvidia和AMD GPU。用户可以通过命令行接口进行操作，并提供HTTP API文档。其他功能包括系统音频转录、麦克风转录、说话人分割，未来还将支持iOS和Android。

OpenAI-Bridge - Blender插件，集成OpenAI API实现图像生成与音频转录功能

BlenderOpenAI插件图像生成音频转录Github开源项目

OpenAI-Bridge是一款Blender插件，帮助用户在Blender中集成OpenAI API功能，包括图像生成与编辑、音频转录、聊天、以及Blender Python代码生成与编辑。支持的模型有DALL-E, whisper-1, gpt-3.5-turbo, gpt-4和gpt-4-32k。用户可以通过插件文档获取安装指南、使用教程和最新更新，并通过GitHub报告问题、请求新功能和参与讨论。

whisper-clip - 一键音频转文本，自动保存到剪贴板

WhisperClip自动转录音频转录OpenAI剪贴板Github开源项目

WhisperClip是一款自动转录音频并将文本直接保存至剪贴板的工具。只需点击按钮即可将口语转换为书面文本。应用支持Python 3.8及以上版本，使用OpenAI的Whisper技术，无论GPU还是CPU都能选择合适的模型以确保最佳性能。用户可以提供反馈并参与改进项目。

whisper.rn - React Native环境中的Whisper自动语音识别模型的高性能实现

whisper.rn自动语音识别React Native音频转录whisper.cppGithub开源项目

whisper.rn是React Native环境中OpenAI的Whisper自动语音识别模型的高性能实现，支持iOS和Android平台，具备实时转录功能，并集成Core ML和NDK优化。项目提供详细的安装与使用指南及实用技巧，适合在移动应用中集成语音识别功能。

Whisper-transcription_and_diarization-speaker-identification- - 使用OpenAI Whisper进行音频转录和说话人识别的完整教程

WhisperOpenAIdiarization音频转录人工智能Github开源项目

本教程详细介绍如何使用OpenAI Whisper进行音频转录和说话人识别，并结合pyannote-audio进行对话分析。学习如何准备音频、区分说话人，并将结果与转录文本匹配，实现智能音频分析。

Stage-Whisper - 跨平台免费开源音频转录工具

Stage-Whisper音频转录Whisper开源应用程序Github开源项目

Stage Whisper是一款免费开源的音频转录应用，基于OpenAI的Whisper模型，提供精确的音频文件转录。它拥有直观的图形界面，用户可以轻松存储和编辑转录内容。该项目旨在让非技术用户也能方便地使用Whisper的强大功能。适用于MacOS、Windows和Linux多平台，目前正进行重大改进，测试版即将发布。

swiss_army_llama - 用 FastAPI 为各种任务公开方便的 REST 端点来促进和优化与本地 LLM 一起工作的过程

Swiss Army LlamaFastAPI文本嵌入音频转录FAISS向量搜索Github开源项目

一个优化本地LLM的工具集，提供文本嵌入、语句相似度计算、文档处理和音频转录。利用FastAPI暴露REST端点，通过llama_cpp处理文本、PDF和音频文件，自动完成OCR并计算嵌入。支持高级相似度测量和语义搜索，集成FAISS向量搜索。可选用RAM Disk加速，配置简易，兼容多种模型和方法，便于快速集成到应用中。

wordcab-transcribe - 开源语音识别与说话人分离API

Wordcab Transcribe语音识别API音频转录faster-whisperGithub开源项目

Wordcab Transcribe是一个基于FastAPI的开源语音识别API。它使用faster-whisper进行音频转录，自动调谐谱聚类技术实现说话人分离。该项目具有处理速度快、易于部署、支持批量请求等特点，可通过本地开发或Docker部署。API支持音频文件和YouTube视频的转录，适用于商业用途。

Descript - AI驱动的文本式视频编辑工具

AI工具AI视频编辑文字编辑视频音频转录AI语音合成多平台内容创作

Descript是一款AI驱动的视频编辑工具,通过文本编辑方式实现音视频处理。它提供AI语音生成、模板设计、智能剪辑、翻译、眼神校正等功能,简化了视频制作流程。该工具支持从录制到发布的全过程,适合各类创作者和团队使用。Descript将复杂的视频编辑转化为简单的文档编辑体验,提高了内容创作效率。

TurboScribe - 高效精准的AI音视频转录服务

AI工具语音转文字音频转录视频转录AI转录Whisper

TurboScribe提供高效的AI音视频转录服务，支持98种语言，准确率达99.8%。该工具可快速将音频和视频转换为文本，支持10小时长文件上传，具备说话人识别和字幕生成功能。采用无限制订阅模式，适合需要大量转录的个人和团队。还可将转录或字幕翻译成134种语言，是一个全面的音视频转文字解决方案。

Audiotype - 高效多语言音视频转文字软件自动转录准确快速

AI工具语音转文字自动转录软件音频转录视频转录语音识别

Audiotype为专业音视频自动转录软件，支持30多种语言和各类音视频格式。采用AI技术，转录准确率达80-95%，无需注册即可使用。适用于记者、学生、视频制作者等群体，提供字幕生成、文本编辑和分享功能。注重数据隐私，15天后自动删除用户文件，是高效可靠的音视频转文字解决方案。

Transcri - AI多语言音频转文字和字幕生成工具

AI工具音频转录字幕生成多语言支持在线编辑器协作平台

Transcri提供AI驱动的在线音频转文字和字幕生成服务。支持50多种语言的自动转录，可将音频视频快速转换为文本并生成多格式字幕。平台功能包括免费服务、隐私保护、AI校正、多语言翻译、多格式导出和在线编辑。适用于个人和团队的全面音频文字转换解决方案。

SpeedyAudios - WhatsApp语音消息转文字工具节省时间提高效率

AI工具WhatsApp语音转写语音转文字SpeedyAudios音频转录效率工具

SpeedyAudios是一款WhatsApp语音转文字工具，能在10秒内完成转录。适用于处理长语音、无耳机、安静环境或需搜索信息等场景。支持多语言转录，提高信息处理效率。用户只需将语音转发至SpeedyAudios聊天机器人即可获得文字稿，避免了听冗长语音的麻烦。这种快速便捷的方式为WhatsApp用户提供了高效的语音消息处理解决方案。

SIREN - 综合音频AI解决方案支持多语言多功能语音处理

AI工具AI语音音频转录文字转语音视频配音多语言支持

该平台集成多种音频AI技术，提供语音转文字、音频笔记、文字转语音、视频配音和直播字幕等服务。支持120多种语言和多种音频格式，具备可视化和摘要功能。平台提供420多种AI语音风格，覆盖100多种语言的文本转语音服务。用户可轻松实现内容国际化，无需编码即可处理各类音频任务。适用于教育培训、媒体制作、客户服务等多个领域，显著提升工作效率和内容质量。

Origlio - 音频转文字服务快速处理语音信息

AI工具音频转录WhatsAppTelegramAI技术语音助手

Origlio提供专业的语音消息转录服务，支持WhatsApp和Telegram平台。该工具能将语音快速转换为文字，并提供分段转录和时间标记功能。用户可轻松获取音频内容摘要，提高信息处理效率。Origlio采用AI技术确保转录准确度，适用于无法即时收听或需要快速浏览大量语音信息的场景。未来还将推出跨语言翻译功能，进一步扩展其应用范围。

Shush - WhisperV3模型的全栈语音转文本应用演示

ShushWhisperV3ModalNextJS音频转录Github开源项目

Shush是一个开源项目，展示了如何在Modal平台上部署WhisperV3语音识别模型，并通过NextJS应用程序实现交互。该项目集成了Next.js前端和Modal后端，演示了高性能模型运行、可靠API构建和自动扩展功能。开发者可以通过此项目学习如何快速部署AI模型后端，并构建响应式前端应用，实现高效的语音转文本功能。

Whisper JAX：让你的语音转文字功能速度快70倍！

2024年08月03日

Buzz: 离线音频转录与翻译的革新工具

2024年08月29日

Faster-Whisper: 提升语音识别速度和效率的革新性工具

2024年08月29日

Whishper: 一款强大的本地化音频转录和字幕编辑套件

2024年08月30日

Whishper: 开源本地音频转录和字幕编辑套件

2024年08月30日

Whisper JAX: 最快的语音识别模型实现

2024年08月30日

OpenAI Whisper: 开源语音识别的革命性突破

2024年08月30日

OpenAI Bridge：为Blender带来人工智能的强大功能

2024年08月31日

Vibe: 开源离线语音转文字工具的新选择

2024年08月31日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com