Project Icon

audapolis

多媒体编辑器提供文字处理器式体验

audapolis是一款开源的多媒体编辑工具,为口语媒体编辑提供类似文字处理器的操作体验。该工具支持音频自动转录为文本,适用于视频、音频和混合编辑,可用于制作广播节目、播客、有声书和采访片段等内容。audapolis重视用户隐私,采用本地存储方式,无需云端服务。该软件支持Windows、Linux和macOS平台,致力于简化媒体编辑工作流程。

Amphion - Amphion开源工具集,支持音频、音乐、语音生成及多任务评估
AmphionGithub声码器开源项目文本到语音语音生成音乐生成
Amphion是一个开源的音频、音乐和语音生成工具集,旨在支持可重复的研究并帮助研究人员和工程师入门。提供TTS、SVS、VC、SVC、TTA等生成任务,集成高级语音编码器和评估指标,如F0建模、能量建模、语音相似度测评。功能包括模型可视化、数据集建设及文本到音频/音乐的实现,推动音频生成技术应用。
makeaudio.app - AI驱动的多语言文本转语音工具 支持多样化音色和输出格式
AI工具多语言支持文本转音频语音合成语音选项音频格式
makeaudio.app是一款AI驱动的文本转语音工具,支持16种语言输入和6种自然音色。可处理10万字符的文本,输出MP3、WAV和FLAC格式音频。该工具便于创建高质量音频内容,适用于播客和有声书制作等多种场景。其多语言支持和灵活输出选项使其成为全面的文本转语音解决方案。
Stable Audio Open - 开源文本转音频模型 生成高质量短音频样本和音效
AI工具Stable Audio Open开源模型文本到音频音效制作音频生成
Stable Audio Open是一个开源的文本转音频生成模型,专注于创建短音频样本、音效和音乐制作元素。用户可通过文本提示生成最长47秒的高质量音频。该模型适用于创建鼓点、乐器片段、环境音效和拟音效果等。作为免费开源工具,它为音乐制作和声音设计提供了实用的解决方案。用户可以使用自己的数据微调模型,生成个性化音效。此外,模型支持部署到个人设备,便于自定义使用。
autocut - 基于字幕编辑的智能视频剪辑工具
AutoCutGithubPython工具字幕生成开源项目视频剪辑
AutoCut是一款创新的开源视频编辑工具,通过自动生成字幕并让用户编辑文本来实现视频剪辑。无需使用复杂的视频编辑软件,只需编辑文本文件即可完成视频剪切。该工具支持多种安装方式,包括pip安装和Docker部署,并提供了丰富的功能,如使用不同的Whisper模型、GPU加速和批量处理等。AutoCut简化了视频编辑流程,适用于多种场景。
vibe - 离线音视频转录,多语言支持和多格式输出
GithubOpenAI WhisperVibe开源项目批量转录隐私音频转录
Vibe利用开源工具OpenAI Whisper进行离线音视频转录,支持几乎所有语言,保证数据隐私。软件界面友好,支持多种文件格式如SRT、VTT、TXT、HTML、PDF和JSON。Vibe还具备批量转录、多语言翻译和实时预览等功能,适用于Windows、Linux和macOS系统。优化了对CPU和GPU的支持,兼容Nvidia和AMD GPU。用户可以通过命令行接口进行操作,并提供HTTP API文档。其他功能包括系统音频转录、麦克风转录、说话人分割,未来还将支持iOS和Android。
avidemux2 - 跨平台开源视频编辑工具Avidemux
AvidemuxGithub多媒体处理开源项目视频编辑器跨平台软件
Avidemux是一款开源的跨平台视频编辑工具,兼容Linux、Windows和macOS。软件提供GitHub发布版和每日构建版下载,同时附有详细的源代码编译指南。支持系统级libass库,配备便捷启动脚本,并为macOS用户提供Apple Silicon和Intel处理器的专属构建说明。
Alphy - 多功能AI音频处理和内容创作助手
AI工具AI转录内容生成多语言支持生产力工具音频处理
Alphy是一款多功能AI音频处理工具,支持YouTube、Twitter、Twitch和播客等多种音频源。该工具可将音频快速转为文本,提供关键要点摘要,并能基于音频内容创建新的吸引人的内容。Alphy具备多语言支持、自定义AI助手和SEO优化等功能,适合内容创作者、学习者和专业人士使用,有助于提高工作效率。
Voxpad - 高效智能的视频音频转笔记解决方案
AI工具AI转录笔记生成自动化笔记订阅计划语音识别
Voxpad是领先的AI笔记工具,专注于视频转文字和音频转笔记。这款创新工具支持多种文件格式,配备时间戳和智能编辑功能,通过AI自动补全技术提升效率。用户可轻松上传、生成和编辑笔记,享受安全的存储环境。Voxpad提供灵活的订阅计划,满足不同预算需求,是提高学习和工作效率的理想AI笔记解决方案。
Wondercraft - 简易的AI音频编辑与创作平台
AI工具AI音频Wondercraft广告制作播客制作有声书制作热门音频内容制作音频生成
通过AI技术驱动的Wondercraft音频工作室,用户可快速创建播客、广告和有声书等内容。平台支持多语言操作和团队协作,适用于营销、写作和教育等多种场景。
PodTextify - 将播客音频转换为多语言文本的智能工具
AI工具PodTextifySEO优化多语言翻译播客转录自动转录
PodTextify是一款播客转录和翻译工具,支持将音频快速转换为文本,并提供100多种语言的翻译服务。该工具通过自动化流程提高内容制作效率,同时利用SEO优化功能增强播客可见度。PodTextify针对不同规模的播客制作者设计了灵活的订阅计划,旨在帮助用户扩大全球影响力。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号