Logo

#语音生成

大型语言模型与多模态生成的完美融合:Awesome-LLMs-meet-Multimodal-Generation项目深度解析

2 个月前
Cover of 大型语言模型与多模态生成的完美融合:Awesome-LLMs-meet-Multimodal-Generation项目深度解析

MyGirlGPT: 打造你专属的AI女友

2 个月前
Cover of MyGirlGPT: 打造你专属的AI女友

Amphion: 开源音频、音乐和语音生成工具包

2 个月前
Cover of Amphion: 开源音频、音乐和语音生成工具包

相关项目

Project Cover
Amphion
Amphion是一个开源的音频、音乐和语音生成工具集,旨在支持可重复的研究并帮助研究人员和工程师入门。提供TTS、SVS、VC、SVC、TTA等生成任务,集成高级语音编码器和评估指标,如F0建模、能量建模、语音相似度测评。功能包括模型可视化、数据集建设及文本到音频/音乐的实现,推动音频生成技术应用。
Project Cover
dla
此课程详细介绍了音频深度学习的各个方面,包括数字信号处理、语音识别、源分离、文本转语音、语音转换、语音生物识别及音频生成扩散模型。每周更新课程材料,涵盖从理论讲解到实操的全面学习。提供全面的作业和丰富的学习资源,适合深入了解音频处理技术的人士。
Project Cover
Awesome-LLMs-meet-Multimodal-Generation
本项目综述了大语言模型在多模态生成和编辑领域的应用。涵盖图像、视频、3D和音频等多种模态,重点介绍基于大语言模型的技术。同时探讨多模态代理、理解和安全性问题。为研究人员提供全面资源,展示大语言模型在多模态内容创作中的最新进展。
Project Cover
Chipmunks AI
Chipmunks AI整合多种AI内容生成技术,包括图像、语音和文本。平台拥有100多种模板和工具,支持20余种语言,可应用于博客、社交媒体和广告等领域。基于Chip X2技术,具备高效的AI处理能力和团队协作功能,助力各类创作者提升内容质量和工作效率。
Project Cover
TopMediai
TopMediai集成多种AI驱动的在线工具,专注音频和内容创作。提供文本转语音、AI歌曲翻唱、AI音乐生成、语音克隆等功能。拥有3200多种逼真AI语音,支持190多种语言和口音,适用于视频配音、播客制作等场景。平台致力提供简单高效的AI工具,助创作者节省时间精力,提升内容质量。持续更新迭代,确保用户获得最新AI技术支持。
Project Cover
StarVoice
StarVoice是一款AI名人语音视频生成工具,提供丰富角色库和自定义声音克隆。支持多语言,适用于娱乐和创意制作。拥有30,500+用户,持续更新角色,提供多样化AI生成体验。
Project Cover
AI Clone Voice Free
AI Clone Voice Free作为在线AI声音克隆平台,提供免费即时声音克隆服务。用户仅需上传10秒语音样本,即可生成高度相似的AI声音。平台支持多种语言和口音,注重用户隐私保护,操作界面简单直观。无需注册,可无限次使用,一键生成和下载克隆声音。适用范围广泛,涵盖娱乐、无障碍、数字助手和配音等领域,为用户提供高效便捷的AI语音克隆解决方案。
Project Cover
Voice AI Note
Voice AI Note是一个智能语音笔记生成平台,通过先进的人工智能技术实现快速、准确的语音转文字。该平台界面直观,支持多样化的语音记录需求,如会议记录、个人备忘和创意构思等。Voice AI Note致力于提升用户的工作效率和创意表达能力。该平台基于Next.js和React等先进技术构建,确保了稳定的性能和良好的用户体验。
Project Cover
Online Text to Speech with Emotions
这是一款免费的AI驱动英文文本转语音工具。它能将文本转换为带有情感和风格的自然语音。用户可选择多种声音、语调和情感,快速生成高质量音频。适用于社交媒体配音,支持跨平台使用,并提供安全保障。该工具为创作者提供了便捷的文本转语音解决方案。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号