#语音克隆

TerifAI: 令人震惊的AI语音克隆技术及其潜在影响

3 个月前

语音克隆聊天机器人声音模仿教育目的防诈骗 Github 开源项目

3 个月前

VITS快速微调：打造个性化多语言语音合成与声音转换系统

3 个月前

VITS 语音克隆文本转语音多语言声音转换 Github 开源项目

3 个月前

GPT-SoVITS-Server: 极简配置的AI语音合成推理服务

3 个月前

GPT-SoVITS 语音克隆模型训练推理合成服务器部署 Github 开源项目

3 个月前

Voice-Cloning-App: 开源语音克隆应用的新突破

3 个月前

Voice Cloning App 语音克隆 Pytorch 人工智能数据集 Github 开源项目

3 个月前

WhisperSpeech: 开源文本转语音技术的新突破

3 个月前

WhisperSpeech 文本转语音多语言支持开源模型语音克隆 Github 开源项目

3 个月前

TTS Generation WebUI: 一站式文本转语音解决方案

3 个月前

TTS Generation WebUI 音频生成语音克隆音频转换软件更新 Github 开源项目

3 个月前

MetaVoice-1B: 开源人性化表情丰富的文本转语音基础模型

3 个月前

MetaVoice-1B TTS 语音克隆情感语音开源 Github 开源项目

3 个月前

MetaVoice-1B: 开源人性化表达式文本转语音模型

3 个月前

MetaVoice-1B TTS 语音克隆情感语音开源 Github 开源项目

3 个月前

MetaVoice-1B: 开源的人性化表达文本转语音基础模型

3 个月前

MetaVoice-1B TTS 语音克隆情感语音开源 Github 开源项目

3 个月前

RealChar: 打造您的实时AI角色伙伴

3 个月前

RealChar AI字符实时互动语音克隆人工智能 Github 开源项目热门

3 个月前

相关项目

OpenVoice

OpenVoice是一款革命性的语音克隆工具，提供准确的音色复制和灵活的声音风格控制，支持多种语言和口音。V2版本进一步强化了音质，并增设了多种母语级支持，包括英语、西班牙语、法语、中文、日语和韩语，并从2024年4月起免费提供商业使用。OpenVoice已广泛应用于即时语音克隆功能，并在全球范围内持续扩展用户群体。

RealChar

RealChar提供了一个革新的平台，允许用户无需编程即可创建、定制并与自己的AI人物实时对话。该平台支持Web、终端和移动设备，采用最新的AI技术，包括OpenAI和Anthropic Claude 2等。用户可以通过简单的操作，定制AI人物的性格、背景及声音，使其更加个性化。RealChar适合任何希望探索AI交互和技术的用户，无论是AI爱好者还是开发人员。

Vozo

Vozo，一款AI视频编辑工具，通过AI提示实现视频重写、重新配音与调整。可快速将经典或普通视频变化为具吸引力的宣传片或喜剧，支持多语言翻译和社交媒体平台视频定制。

Uberduck

Uberduck是一个支持多语言的AI语音合成服务平台，提供文本到语音转换、歌声生成和语音克隆技术。它帮助音乐制作人、内容创作者和营销人员通过AI技术，提升音频内容的创造与编辑能力。

ElevenLabs

ElevenLabs 提供先进的文本到语音和AI语音生成服务，支持多种语言和声音。真实且响应迅速的人声模拟，可广泛应用于内容创作、客户互动等领域，突破语言壁垒，优化数字交互。

Reecho.AI

Reecho睿声是专业的多语言语音合成与瞬时克隆平台，采用先进AI技术，快速实现与真人无异的拟真语音。平台支持丰富的应用场景，包括视频制作、有声内容制备等，能有效解析文本与声音的细微关系，输出自然且富有表现力的声音效果。

NaturalReader Home

NaturalReader是一个专业文本到语音平台，涵盖50种语言和200种AI语音，支持PDF等20多种格式。运用先进的大型语言模型（Large Language Models, LLM）技术，提供高质量的声音克隆和声音生成，广泛应用于教育、商业和增强无障碍通讯。

VALL-E-X

VALL-E X是微软提出的多语言文本到语音合成模型，支持英语、中文和日语。这款开源模型通过几秒的声音样本，能够生成高质量、个性化的语音输出。它整合了多项先进技术如情感控制及跨语言语音合成，使其能够模拟多种语音和情绪，便于快速体验次世代语音合成技术。加入了开源实现和创新技术应用，强调其技术先进性和应用广泛性。

metavoice-src

MetaVoice-1B是一个开源的1.2B参数TTS模型，经过10万小时的语音训练，支持英语情感语音合成和零样本的美式和英式语音克隆（仅需30秒参考音频）。该模型还支持跨语言声音克隆和任意长度文本的语音合成。可通过云端或本地部署使用，并提供Hugging Face和Google Colab的演示。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com