audapolis

多媒体编辑器提供文字处理器式体验

audapolis 音频编辑器文字转录媒体编辑开源软件 Github 开源项目

audapolis是一款开源的多媒体编辑工具，为口语媒体编辑提供类似文字处理器的操作体验。该工具支持音频自动转录为文本，适用于视频、音频和混合编辑，可用于制作广播节目、播客、有声书和采访片段等内容。audapolis重视用户隐私，采用本地存储方式，无需云端服务。该软件支持Windows、Linux和macOS平台，致力于简化媒体编辑工作流程。

访问官网

Github

介绍相关项目

Amphion - Amphion开源工具集，支持音频、音乐、语音生成及多任务评估

AmphionGithub声码器开源项目文本到语音语音生成音乐生成

Amphion是一个开源的音频、音乐和语音生成工具集，旨在支持可重复的研究并帮助研究人员和工程师入门。提供TTS、SVS、VC、SVC、TTA等生成任务，集成高级语音编码器和评估指标，如F0建模、能量建模、语音相似度测评。功能包括模型可视化、数据集建设及文本到音频/音乐的实现，推动音频生成技术应用。

makeaudio.app - AI驱动的多语言文本转语音工具支持多样化音色和输出格式

AI工具多语言支持文本转音频语音合成语音选项音频格式

makeaudio.app是一款AI驱动的文本转语音工具，支持16种语言输入和6种自然音色。可处理10万字符的文本，输出MP3、WAV和FLAC格式音频。该工具便于创建高质量音频内容，适用于播客和有声书制作等多种场景。其多语言支持和灵活输出选项使其成为全面的文本转语音解决方案。

Stable Audio Open - 开源文本转音频模型生成高质量短音频样本和音效

AI工具Stable Audio Open开源模型文本到音频音效制作音频生成

Stable Audio Open是一个开源的文本转音频生成模型，专注于创建短音频样本、音效和音乐制作元素。用户可通过文本提示生成最长47秒的高质量音频。该模型适用于创建鼓点、乐器片段、环境音效和拟音效果等。作为免费开源工具，它为音乐制作和声音设计提供了实用的解决方案。用户可以使用自己的数据微调模型，生成个性化音效。此外，模型支持部署到个人设备，便于自定义使用。

autocut - 基于字幕编辑的智能视频剪辑工具

AutoCutGithubPython工具字幕生成开源项目视频剪辑

AutoCut是一款创新的开源视频编辑工具，通过自动生成字幕并让用户编辑文本来实现视频剪辑。无需使用复杂的视频编辑软件，只需编辑文本文件即可完成视频剪切。该工具支持多种安装方式，包括pip安装和Docker部署，并提供了丰富的功能，如使用不同的Whisper模型、GPU加速和批量处理等。AutoCut简化了视频编辑流程，适用于多种场景。

vibe - 离线音视频转录，多语言支持和多格式输出

GithubOpenAI WhisperVibe开源项目批量转录隐私音频转录

Vibe利用开源工具OpenAI Whisper进行离线音视频转录，支持几乎所有语言，保证数据隐私。软件界面友好，支持多种文件格式如SRT、VTT、TXT、HTML、PDF和JSON。Vibe还具备批量转录、多语言翻译和实时预览等功能，适用于Windows、Linux和macOS系统。优化了对CPU和GPU的支持，兼容Nvidia和AMD GPU。用户可以通过命令行接口进行操作，并提供HTTP API文档。其他功能包括系统音频转录、麦克风转录、说话人分割，未来还将支持iOS和Android。

avidemux2 - 跨平台开源视频编辑工具Avidemux

AvidemuxGithub多媒体处理开源项目视频编辑器跨平台软件

Avidemux是一款开源的跨平台视频编辑工具，兼容Linux、Windows和macOS。软件提供GitHub发布版和每日构建版下载，同时附有详细的源代码编译指南。支持系统级libass库，配备便捷启动脚本，并为macOS用户提供Apple Silicon和Intel处理器的专属构建说明。

Alphy - 多功能AI音频处理和内容创作助手

AI工具AI转录内容生成多语言支持生产力工具音频处理

Alphy是一款多功能AI音频处理工具，支持YouTube、Twitter、Twitch和播客等多种音频源。该工具可将音频快速转为文本，提供关键要点摘要，并能基于音频内容创建新的吸引人的内容。Alphy具备多语言支持、自定义AI助手和SEO优化等功能，适合内容创作者、学习者和专业人士使用，有助于提高工作效率。

Voxpad - 高效智能的视频音频转笔记解决方案

AI工具AI转录笔记生成自动化笔记订阅计划语音识别

Voxpad是领先的AI笔记工具，专注于视频转文字和音频转笔记。这款创新工具支持多种文件格式，配备时间戳和智能编辑功能，通过AI自动补全技术提升效率。用户可轻松上传、生成和编辑笔记，享受安全的存储环境。Voxpad提供灵活的订阅计划，满足不同预算需求，是提高学习和工作效率的理想AI笔记解决方案。

Wondercraft - 简易的AI音频编辑与创作平台

AI工具AI音频Wondercraft广告制作播客制作有声书制作热门音频内容制作音频生成

通过AI技术驱动的Wondercraft音频工作室，用户可快速创建播客、广告和有声书等内容。平台支持多语言操作和团队协作，适用于营销、写作和教育等多种场景。

PodTextify - 将播客音频转换为多语言文本的智能工具

AI工具PodTextifySEO优化多语言翻译播客转录自动转录

PodTextify是一款播客转录和翻译工具，支持将音频快速转换为文本，并提供100多种语言的翻译服务。该工具通过自动化流程提高内容制作效率，同时利用SEO优化功能增强播客可见度。PodTextify针对不同规模的播客制作者设计了灵活的订阅计划，旨在帮助用户扩大全球影响力。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号