#语音转文字

Whisper Plugin for Obsidian: 让语音转文字变得简单

2 个月前
Cover of Whisper Plugin for Obsidian: 让语音转文字变得简单

RealtimeSTT_LLM_TTS:实现实时语音交互的开源项目

2 个月前
Cover of RealtimeSTT_LLM_TTS:实现实时语音交互的开源项目

Leopard:自然界中优雅而神秘的掠食者

2 个月前
Cover of Leopard:自然界中优雅而神秘的掠食者

实时翻译打字: 跨越语言障碍的革命性工具

2 个月前
Cover of 实时翻译打字: 跨越语言障碍的革命性工具

WhisperCPP: 高效的语音识别技术在C++中的实现

2 个月前
Cover of WhisperCPP: 高效的语音识别技术在C++中的实现

WhisperPlus: 更快、更智能、更强大的语音识别工具

2 个月前
Cover of WhisperPlus: 更快、更智能、更强大的语音识别工具

WhisperPlus:更快、更智能、更强大的语音识别工具

2 个月前
Cover of WhisperPlus:更快、更智能、更强大的语音识别工具

Whisper-TikTok: AI驱动的TikTok视频创作工具

3 个月前
Cover of Whisper-TikTok: AI驱动的TikTok视频创作工具

猎豹:速度与优雅并存的野生动物之王

3 个月前
Cover of 猎豹:速度与优雅并存的野生动物之王

NotesGPT: 革新语音笔记的AI助手

3 个月前
Cover of NotesGPT: 革新语音笔记的AI助手
相关项目
Project Cover

听脑AI

听脑AI为会议、教育、销售等领域提供智能语音助手,支持录音转文字、AI总结与文字生成配音。该技术适用于会议、课堂以及内容创作,有助于提高工作与学习效率,简化信息管理。支持多端同步,操作简便,是理想的语音转写工具。

Project Cover

whisper-website

本页面介绍了如何通过Whisper模型将语音转换为文字,包括在本地环境和Docker中的部署方法。提供克隆项目代码、配置虚拟环境或Docker镜像的详细步骤,帮助用户快速启动和测试Whisper模型在本地的运行效果。

Project Cover

Whisper-WebUI

Whisper-WebUI是基于Gradio的浏览器界面,支持从文件、YouTube和麦克风生成字幕,并提供多语言翻译。用户可以选择不同的Whisper实现,如openai/whisper、faster-whisper和insanely-fast-whisper,支持SRT、WebVTT、txt等多种字幕格式。功能包括语音转文字翻译、音频预处理(Silero VAD)和说话人分离(pyannote)。提供详细的安装指南与自动安装脚本,并且兼容Docker运行,提升VRAM利用率和转录速度。

Project Cover

notesGPT

notesGPT是一个开源的AI语音笔记工具,可快速将语音内容转化为行动项目。该工具集成了Convex、Together.ai和Whisper等技术,实现了语音转录、内容总结和高效搜索功能。适用于会议记录、想法整理和任务规划等场景,有助于提升信息管理效率。项目支持自行部署,并在持续优化中。

Project Cover

cheetah

Cheetah是一款本地化实时语音转文字引擎,具有隐私保护、高精度和跨平台特性。该引擎支持Linux、macOS、Windows、Android、iOS和主流浏览器等多种平台。Cheetah为开发者提供多种编程语言的SDK和演示应用,支持实时麦克风输入和音频文件处理,是一个灵活的语音识别解决方案。

Project Cover

Whisper-TikTok

Whisper-TikTok是一个开源项目,集成了Edge TTS、OpenAI-Whisper和FFMPEG技术,用于自动生成TikTok视频。该工具可以从音频文件生成转录,使用Microsoft Edge Cloud TTS API添加配音,并支持自定义背景视频和字幕样式。项目提供Web应用和命令行界面,方便用户创建TikTok内容。Whisper-TikTok为内容创作者提供了自动化视频生成的解决方案。

Project Cover

voiceai.pro

voiceai.pro提供智能语音转换多样化文字内容服务。该平台能快速将语音记录或音频文件转化为高质量文字,涵盖LinkedIn帖子、博客文章、电子邮件、房产描述、菜谱生成和职位描述等多种形式。AI技术确保转换准确度高,操作界面直观易用。平台旨在提高内容生成效率,节省时间成本,有效提升数字营销效果。voiceai.pro致力于为各行各业的专业人士和内容创作者提供快速、多样化的内容创作解决方案。

Project Cover

File Transcribe

File Transcribe是一个基于AI的音视频转录和分析平台。该平台提供高精度的多语言转录服务,具备说话人分离、摘要生成、情感分析、意图识别等先进功能。File Transcribe支持清理填充词、生成字幕,并提供音频播放等实用工具。其全面的转录解决方案适用于个人、团队和企业用户,有助于简化工作流程,提高效率。平台还具备云存储、安全保护等附加功能,为各类转录需求提供一站式服务。

Project Cover

魔撰写作

魔撰写作是国内的AI写作平台,为写作者提供智能写作、文案提取、文风改写、多语言翻译等服务。利用AI技术,支持用户高效创作原创内容,润色文采,优化语句。适用于商务文案、学术文章和文艺创作,简化写作流程,提高效率。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号