#转录

Stable-ts: 基于OpenAI Whisper的高精度音频转录与时间戳对齐工具

3 个月前
Cover of Stable-ts: 基于OpenAI Whisper的高精度音频转录与时间戳对齐工具

使用whisper-node在Node.js中实现本地语音转文字功能

3 个月前
Cover of 使用whisper-node在Node.js中实现本地语音转文字功能

Audioflare: 一站式AI音频处理平台

3 个月前
Cover of Audioflare: 一站式AI音频处理平台

SwiftWhisper: 最简便的Swift音频转录工具

3 个月前
Cover of SwiftWhisper: 最简便的Swift音频转录工具

StoryToolkitAI:一款革命性的AI驱动视频编辑工具

3 个月前
Cover of StoryToolkitAI:一款革命性的AI驱动视频编辑工具
相关项目
Project Cover

SpotifyTranscripts

SpotifyTranscripts通过AI技术生成播客字幕和自动分段,提升内容查找和听力障碍者的访问体验。主要功能包括将语音转为文本、自动生成章节和搜索功能,帮助用户快速找到感兴趣的内容。结合Spotify API和Open AI API,实现了便捷的播客内容管理和用户互动,适用于需要精确内容定位和字幕功能的播主和听众。

Project Cover

SwiftWhisper

SwiftWhisper利用whisper.cpp为应用或软件包添加语音转录功能。通过Swift Package Manager或Xcode进行安装,支持多种平台和Swift版本。提供详细的API文档和CoreML支持,通过AudioKit将音频转换成16kHz PCM格式,是高效语音转录的理想选择。

Project Cover

audioflare

Audioflare是一个采用Cloudflare AI Workers的开源项目,提供音频转录、分析、总结和多语言翻译功能。其主要功能包括语音转文本、文本摘要、情感分析和九种语言的翻译,并提供性能指标和监控支持。虽然转录功能目前限于30秒,但该项目展示了标准化的AI API请求框架,为开发者提供了学习和探索的机会。

Project Cover

whisper-node

Whisper-node是OpenAI Whisper的Node.js绑定,支持本地转录,输出格式包括JSON、.txt、.srt和.vtt。该项目经过CPU优化,支持Apple Silicon ARM,并提供单词级精度的时间戳。通过npm可快速安装,并可选下载模型。未来将增加浏览器兼容性、语言检测和说话者识别等新功能。

Project Cover

stable-ts

stable-ts是一个开源的Whisper语音转录优化工具。它通过改进时间戳生成算法,提高了转录结果的时间精确度。该工具扩展了Whisper的功能,增加了语音分离、降噪和时间戳调整等特性。stable-ts支持多种输出格式,并提供API和命令行接口,使语音转录更加稳定和高效。

Project Cover

clipsai

ClipsAI是一个Python开源库,专门用于处理音频为主的叙事视频。这个库能自动将长视频分割成多个短片,并支持将视频宽高比从16:9调整为9:16。它利用WhisperX进行视频转录,通过Pyannote实现说话人分离,从而实现动态重构画面和聚焦当前说话者。ClipsAI适用于播客、采访和演讲等类型的视频,只需几行代码即可完成视频的智能裁剪和比例调整。

Project Cover

File Transcribe

File Transcribe是一个基于AI的音视频转录和分析平台。该平台提供高精度的多语言转录服务,具备说话人分离、摘要生成、情感分析、意图识别等先进功能。File Transcribe支持清理填充词、生成字幕,并提供音频播放等实用工具。其全面的转录解决方案适用于个人、团队和企业用户,有助于简化工作流程,提高效率。平台还具备云存储、安全保护等附加功能,为各类转录需求提供一站式服务。

Project Cover

ScriptMe

ScriptMe是一个高效的音视频转录和字幕生成平台。支持30多种语言的快速转录,可将音频和视频内容转换为文本和字幕。提供编辑、导出和分享功能,支持多种格式。适用于媒体制作、政府机构、教育和研究等领域,提高工作效率,节省时间和成本。界面直观,功能强大,是处理音视频内容的实用工具。

Project Cover

StoryToolkitAI

StoryToolkitAI是一款利用AI技术的电影编辑工具,通过视频转录、场景索引和搜索,支持高效编辑。该工具兼容OpenAI GPT-4,能自动生成故事并通过EDL或XML导出到编辑软件。主要功能包括视频索引与搜索、自动转录和翻译、智能搜索、自动检测和分类问题等。工具与DaVinci Resolve Studio 18无缝集成,提供高级时间轴标记搜索和字幕导入功能,旨在提高编辑效率和便捷性。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号