#多语言支持

MoneyPrinterTurbo：支持多语言的视频生成

8 天前

MoneyPrinterTurbo 多语言支持视频自动生成

8 天前

BetterOCR学习资料汇总 - 结合多个OCR引擎和LLM的高级文本识别工具

2 个月前

BetterOCR OCR引擎 LLM 文本检测多语言支持 Github 开源项目

2 个月前

xtts2-ui学习资料汇总 - 仅需10秒语音即可实现文本语音克隆的用户界面

2 个月前

XTTS-2-UI 文本语音克隆多语言支持声音样本语音合成 Github 开源项目

2 个月前

Talkify入门指南 - 为网站添加语音功能的JavaScript库

2 个月前

Talkify 文本转语音多语言支持 API密钥高品质声音 Github 开源项目

2 个月前

SoniTranslate学习资源汇总 - 强大的视频音频翻译工具

2 个月前

SoniTranslate 视频翻译多语言支持 Gradio库开源项目 Github

2 个月前

Expressive-FastSpeech2学习资料汇总 - 非自回归表达式TTS实现

2 个月前

Expressive-FastSpeech2 非自回归TTS 情感TTS 对话TTS 多语言支持 Github 开源项目

2 个月前

parrots入门学习资料 - 开箱即用的语音识别与合成工具包

2 个月前

Parrots 语音识别语音合成自动化多语言支持 Github 开源项目

2 个月前

RHVoice学习资料汇总 - 免费开源的多语言语音合成器

2 个月前

RHVoice 语音合成开源多语言支持跨平台 Github 开源项目

2 个月前

CosyVoice学习资料汇总-多语言大规模语音生成模型

2 个月前

CosyVoice 多语言支持在线演示语音模型跨语言推理 Github 开源项目

2 个月前

MaryTTS 学习资料汇总 - 开源多语言文本转语音系统

2 个月前

MaryTTS 文本转语音开源 Java 多语言支持 Github 开源项目

2 个月前

相关项目

vosk-api

Vosk是一款离线开源语音识别工具包，支持20多种语言和方言。其模型体积小（仅50MB），但能提供连续的大词汇量转录、零延迟响应和流媒体API。支持Python、Java、Node.JS、C#、C++、Rust、Go等多种编程语言。适用于聊天机器人、智能家居设备、虚拟助手，也能为电影创建字幕、为讲座和采访生成转录。Vosk从Raspberry Pi等小型设备到大型集群均可扩展。访问Vosk官网获取安装指南、示例和文档。

ChatGPT-Shortcut

AiShort提供简洁易用的AI提示词，无需了解提示词详情即可通过筛选和搜索找到适合各种场景的选项，提升工作效率。支持多语言优化，一键发送至ChatGPT，轻松收藏、编辑和管理提示词，并通过社区投票系统推荐最佳提示词。兼容多种浏览器，提供详细的部署指南和更新方法，便于用户自定义和分享提示词。

open-webui

Open WebUI是一个为多设备设计的自托管WebUI，支持离线使用，集成LMStudio、GroqCloud等API。支持Docker和Kubernetes安装，提供Markdown、LaTeX支持、多语言翻译、图像生成等功能，并通过角色控制访问权限，定期更新，适用于企业和个人用户。详细信息请访问官方文档。

ChatTTS

ChatTTS是为对话场景特别设计的文本到语音模型，支持多种语言和多发言者交互。该模型优化对话基础任务，支持细粒度的韵律特征控制，如笑声、停顿等。通过使用预训练模型，ChatTTS在自然语言合成和表达能力方面均有突破性进展，适用于教育和研究目的。

OpenVoice

OpenVoice是一款革命性的语音克隆工具，提供准确的音色复制和灵活的声音风格控制，支持多种语言和口音。V2版本进一步强化了音质，并增设了多种母语级支持，包括英语、西班牙语、法语、中文、日语和韩语，并从2024年4月起免费提供商业使用。OpenVoice已广泛应用于即时语音克隆功能，并在全球范围内持续扩展用户群体。

devika

Devika是一款先进的AI软件工程师，能够理解高层次人类指令，并将其分解为步骤，搜索相关信息并编写代码以实现既定目标。该项目支持多种编程语言，集成了大语言模型、高级AI规划和推理能力，并具备无缝的网络浏览和信息获取功能。无论是创建新功能、修复错误还是从头开始开发整个项目，Devika都在此助力。

myGPTReader

myGPTReader是一个革新性的AI阅读助手，支持网页、文档和视频内容的智能阅读。用户可以通过语音与其交流，进行多语种对话，有效提高外语水平。此外，它还集成了最新热点新闻的自动摘要功能，使得用户能迅速掌握当下热门话题。加入超过5000名成员的Slack频道，免费体验myGPTReader的全部功能。

VEED

VEED.IO为全球用户提供高效的文本到语音转换，支持多种语言和真实声音选项，适用于内容制作及广告业务，提升视频生产的效率与质量。

TTS

TTS库基于最新研究成果，提供高效的文本到语音生成技术，实现了训练便捷、速度快、质量高的最佳平衡。该库包括预训练模型和数据集质量评估工具，已被广泛应用于20多种语言的产品和研究项目。支持多说话人TTS、快速模型训练、多GPU训练，并兼容PyTorch、TensorFlow和TFLite等多种平台。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com