#语音生成

大型语言模型与多模态生成的完美融合：Awesome-LLMs-meet-Multimodal-Generation项目深度解析

3 个月前

多模态生成 LLM 图像生成视频生成语音生成 Github 开源项目

3 个月前

Amphion: 开源音频、音乐和语音生成工具包

3 个月前

Amphion 语音生成音乐生成文本到语音声码器 Github 开源项目

3 个月前

MyGirlGPT: 打造你专属的AI女友

3 个月前

MyGirlGPT AI女友个性化语音生成图像生成 Github 开源项目

3 个月前

相关项目

Amphion

Amphion是一个开源的音频、音乐和语音生成工具集，旨在支持可重复的研究并帮助研究人员和工程师入门。提供TTS、SVS、VC、SVC、TTA等生成任务，集成高级语音编码器和评估指标，如F0建模、能量建模、语音相似度测评。功能包括模型可视化、数据集建设及文本到音频/音乐的实现，推动音频生成技术应用。

dla

此课程详细介绍了音频深度学习的各个方面，包括数字信号处理、语音识别、源分离、文本转语音、语音转换、语音生物识别及音频生成扩散模型。每周更新课程材料，涵盖从理论讲解到实操的全面学习。提供全面的作业和丰富的学习资源，适合深入了解音频处理技术的人士。

Awesome-LLMs-meet-Multimodal-Generation

本项目综述了大语言模型在多模态生成和编辑领域的应用。涵盖图像、视频、3D和音频等多种模态，重点介绍基于大语言模型的技术。同时探讨多模态代理、理解和安全性问题。为研究人员提供全面资源，展示大语言模型在多模态内容创作中的最新进展。

Chipmunks AI

Chipmunks AI整合多种AI内容生成技术,包括图像、语音和文本。平台拥有100多种模板和工具,支持20余种语言,可应用于博客、社交媒体和广告等领域。基于Chip X2技术,具备高效的AI处理能力和团队协作功能,助力各类创作者提升内容质量和工作效率。

TopMediai

TopMediai集成多种AI驱动的在线工具,专注音频和内容创作。提供文本转语音、AI歌曲翻唱、AI音乐生成、语音克隆等功能。拥有3200多种逼真AI语音,支持190多种语言和口音,适用于视频配音、播客制作等场景。平台致力提供简单高效的AI工具,助创作者节省时间精力,提升内容质量。持续更新迭代,确保用户获得最新AI技术支持。

StarVoice

StarVoice是一款AI名人语音视频生成工具，提供丰富角色库和自定义声音克隆。支持多语言，适用于娱乐和创意制作。拥有30,500+用户，持续更新角色，提供多样化AI生成体验。

AI Clone Voice Free

AI Clone Voice Free作为在线AI声音克隆平台，提供免费即时声音克隆服务。用户仅需上传10秒语音样本，即可生成高度相似的AI声音。平台支持多种语言和口音，注重用户隐私保护，操作界面简单直观。无需注册，可无限次使用，一键生成和下载克隆声音。适用范围广泛，涵盖娱乐、无障碍、数字助手和配音等领域，为用户提供高效便捷的AI语音克隆解决方案。

Voice AI Note

Voice AI Note是一个智能语音笔记生成平台，通过先进的人工智能技术实现快速、准确的语音转文字。该平台界面直观，支持多样化的语音记录需求，如会议记录、个人备忘和创意构思等。Voice AI Note致力于提升用户的工作效率和创意表达能力。该平台基于Next.js和React等先进技术构建，确保了稳定的性能和良好的用户体验。

Online Text to Speech with Emotions

这是一款免费的AI驱动英文文本转语音工具。它能将文本转换为带有情感和风格的自然语音。用户可选择多种声音、语调和情感，快速生成高质量音频。适用于社交媒体配音，支持跨平台使用，并提供安全保障。该工具为创作者提供了便捷的文本转语音解决方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com