Whisperboard

提供的语音转录服务的开源iOS应用

WhisperBoard iOS 语音转录 OpenAI 灵活模型 Github 开源项目

WhisperBoard是一款开源iOS应用，基于OpenAI的Whisper模型，为用户提供高质量的语音转录服务。用户可通过简单操作开始录音，并进行高级语音转录。此应用支持音频文件的导入与导出，并可灵活选择录音麦克风，以确保最佳音质。用户还可以在应用中浏览和下载不同的Whisper模型，以满足不同需求。未来功能包括实时转录和可恢复转录进程。

访问官网

Github

介绍相关项目

WhisperS2T - 高效多后端语音识别管道实现快速精准转录

GithubWhisperS2T优化管道多后端支持开源项目语音转文本高速推理

WhisperS2T是一个为Whisper模型优化的开源语音识别管道，提供更快的转录速度。它支持OpenAI原始模型、HuggingFace模型和CTranslate2模型等多种推理引擎。该项目具有集成自定义VAD模型、智能处理音频文件、支持多语言和多任务批处理等特点，并能有效减少幻觉输出。WhisperS2T在保持高准确度的同时大幅提升转录速度，为用户提供高效的语音识别解决方案。

Whisper-TikTok - 智能化TikTok视频自动生成工具

AI视频生成GithubWhisper-TikTok开源项目文字转语音自动字幕语音转文字

Whisper-TikTok是一个开源项目，集成了Edge TTS、OpenAI-Whisper和FFMPEG技术，用于自动生成TikTok视频。该工具可以从音频文件生成转录，使用Microsoft Edge Cloud TTS API添加配音，并支持自定义背景视频和字幕样式。项目提供Web应用和命令行界面，方便用户创建TikTok内容。Whisper-TikTok为内容创作者提供了自动化视频生成的解决方案。

faster-whisper-medium - CTranslate2优化的Whisper medium模型支持多语言音频处理

CTranslate2GithubHuggingfaceWhisper开源项目机器翻译模型模型转换语音识别

这是OpenAI Whisper medium模型的CTranslate2优化版本，支持100多种语言的音频转录和识别。模型采用float16量化，通过faster-whisper库易于集成。它具有高效的推理速度和较小的内存占用，适合快速、准确处理多语言音频的应用场景。用户可根据需求调整计算类型，平衡性能和资源消耗。该模型为开发者提供了灵活、高效的多语言音频处理解决方案。

whisper-tiny - Whisper-Tiny转Ratchet格式的跨平台语音识别模型

GithubHuggingfaceRatchetWhisperopenai开源项目模型转换

Whisper-Tiny通过转换为Ratchet格式，在多平台上提供了一种高效的语音识别解决方案。此项目采用GGML转换技术，增强了模型在不同环境中的适应性和处理效率，对开发者与用户来说更具实用价值。项目遵循Apache-2.0开源许可，适合开发者广泛应用和改进。

faster-whisper-medium - 多语言语音识别与转录的高效开源解决方案

CTranslate2GithubHuggingfaceWhisper多语言开源项目模型模型转换自动语音识别

该项目是基于OpenAI Whisper medium模型转换而来的CTranslate2格式模型，为faster-whisper项目提供支持。支持90多种语言的语音识别和转录功能，性能优异且准确度高。用户可通过faster-whisper轻松实现音频文件的高效转录，获取精确的时间戳和文本输出。模型采用float16量化，计算类型可根据需求灵活调整，适用于多种语音识别应用场景。

WhisperFusion - WhisperFusion 低延迟高性能的实时AI语音交互系统

GPU加速GithubTensorRT优化WhisperFusion大语言模型实时语音转文字开源项目

WhisperFusion是一个开源项目，结合WhisperLive和WhisperSpeech技术，集成Mistral大语言模型，实现实时语音转文本和智能对话。项目采用TensorRT引擎优化模型性能，使用torch.compile加速处理，在RTX 4090 GPU上实现低延迟对话。通过Docker Compose简化部署，方便开发者快速搭建AI语音交互系统。

speech-to-text - 实时音频转录系统，兼容多种格式，具备高级配置

GithubNVIDIA GeForce RTX 3060PythonSilero VADfaster-whisper实时转录开源项目

该开源项目使用Silero VAD技术检测静音部分，并结合Faster-Whisper将音频数据转录为文本。支持多种音频格式（如wav、mp3、ogg）和高级设置，如重复惩罚和无重复ngram大小。其HTML界面允许进行详细配置，并能同步显示转录结果，支持CUDA环境运行，兼容最新的Faster-Whisper版本（1.0.3），提升转录速度和准确性。

faster-whisper-medium.en - 优化版Whisper语音识别模型集成CTranslate2框架

CTranslate2GithubHuggingfaceWhisperfaster-whisper开源项目模型模型转换语音识别

faster-whisper-medium.en是OpenAI Whisper-medium.en模型的CTranslate2移植版本，专注于英语音频转文本处理。通过CTranslate2框架优化，支持FP16计算类型，提供Python接口实现音频转录功能，输出包含时间戳的文本片段。项目采用MIT许可证开源，主要面向需要语音识别功能的开发场景。

vibe - 离线音视频转录，多语言支持和多格式输出

GithubOpenAI WhisperVibe开源项目批量转录隐私音频转录

Vibe利用开源工具OpenAI Whisper进行离线音视频转录，支持几乎所有语言，保证数据隐私。软件界面友好，支持多种文件格式如SRT、VTT、TXT、HTML、PDF和JSON。Vibe还具备批量转录、多语言翻译和实时预览等功能，适用于Windows、Linux和macOS系统。优化了对CPU和GPU的支持，兼容Nvidia和AMD GPU。用户可以通过命令行接口进行操作，并提供HTTP API文档。其他功能包括系统音频转录、麦克风转录、说话人分割，未来还将支持iOS和Android。

Shush - WhisperV3模型的全栈语音转文本应用演示

GithubModalNextJSShushWhisperV3开源项目音频转录

Shush是一个开源项目，展示了如何在Modal平台上部署WhisperV3语音识别模型，并通过NextJS应用程序实现交互。该项目集成了Next.js前端和Modal后端，演示了高性能模型运行、可靠API构建和自动扩展功能。开发者可以通过此项目学习如何快速部署AI模型后端，并构建响应式前端应用，实现高效的语音转文本功能。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能，包括文生视频、动态画面和形象生成等，帮助用户快速上手，创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台，用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品，帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型，为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能，满足事务性工作的高频需求，帮助撰稿人节省精力，提高效率，优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号