#多语言支持

MoneyPrinterTurbo:支持多语言的视频生成

8 天前
Cover of MoneyPrinterTurbo:支持多语言的视频生成

BetterOCR学习资料汇总 - 结合多个OCR引擎和LLM的高级文本识别工具

2 个月前
Cover of BetterOCR学习资料汇总 - 结合多个OCR引擎和LLM的高级文本识别工具

xtts2-ui学习资料汇总 - 仅需10秒语音即可实现文本语音克隆的用户界面

2 个月前
Cover of xtts2-ui学习资料汇总 - 仅需10秒语音即可实现文本语音克隆的用户界面

Talkify入门指南 - 为网站添加语音功能的JavaScript库

2 个月前
Cover of Talkify入门指南 - 为网站添加语音功能的JavaScript库

SoniTranslate学习资源汇总 - 强大的视频音频翻译工具

2 个月前
Cover of SoniTranslate学习资源汇总 - 强大的视频音频翻译工具

Expressive-FastSpeech2学习资料汇总 - 非自回归表达式TTS实现

2 个月前
Cover of Expressive-FastSpeech2学习资料汇总 - 非自回归表达式TTS实现

parrots入门学习资料 - 开箱即用的语音识别与合成工具包

2 个月前
Cover of parrots入门学习资料 - 开箱即用的语音识别与合成工具包

RHVoice学习资料汇总 - 免费开源的多语言语音合成器

2 个月前
Cover of RHVoice学习资料汇总 - 免费开源的多语言语音合成器

CosyVoice学习资料汇总-多语言大规模语音生成模型

2 个月前
Cover of CosyVoice学习资料汇总-多语言大规模语音生成模型

MaryTTS 学习资料汇总 - 开源多语言文本转语音系统

2 个月前
Cover of MaryTTS 学习资料汇总 - 开源多语言文本转语音系统
相关项目
Project Cover

vosk-api

Vosk是一款离线开源语音识别工具包,支持20多种语言和方言。其模型体积小(仅50MB),但能提供连续的大词汇量转录、零延迟响应和流媒体API。支持Python、Java、Node.JS、C#、C++、Rust、Go等多种编程语言。适用于聊天机器人、智能家居设备、虚拟助手,也能为电影创建字幕、为讲座和采访生成转录。Vosk从Raspberry Pi等小型设备到大型集群均可扩展。访问Vosk官网获取安装指南、示例和文档。

Project Cover

ChatGPT-Shortcut

AiShort提供简洁易用的AI提示词,无需了解提示词详情即可通过筛选和搜索找到适合各种场景的选项,提升工作效率。支持多语言优化,一键发送至ChatGPT,轻松收藏、编辑和管理提示词,并通过社区投票系统推荐最佳提示词。兼容多种浏览器,提供详细的部署指南和更新方法,便于用户自定义和分享提示词。

Project Cover

open-webui

Open WebUI是一个为多设备设计的自托管WebUI,支持离线使用,集成LMStudio、GroqCloud等API。支持Docker和Kubernetes安装,提供Markdown、LaTeX支持、多语言翻译、图像生成等功能,并通过角色控制访问权限,定期更新,适用于企业和个人用户。详细信息请访问官方文档。

Project Cover

ChatTTS

ChatTTS是为对话场景特别设计的文本到语音模型,支持多种语言和多发言者交互。该模型优化对话基础任务,支持细粒度的韵律特征控制,如笑声、停顿等。通过使用预训练模型,ChatTTS在自然语言合成和表达能力方面均有突破性进展,适用于教育和研究目的。

Project Cover

OpenVoice

OpenVoice是一款革命性的语音克隆工具,提供准确的音色复制和灵活的声音风格控制,支持多种语言和口音。V2版本进一步强化了音质,并增设了多种母语级支持,包括英语、西班牙语、法语、中文、日语和韩语,并从2024年4月起免费提供商业使用。OpenVoice已广泛应用于即时语音克隆功能,并在全球范围内持续扩展用户群体。

Project Cover

devika

Devika是一款先进的AI软件工程师,能够理解高层次人类指令,并将其分解为步骤,搜索相关信息并编写代码以实现既定目标。该项目支持多种编程语言,集成了大语言模型、高级AI规划和推理能力,并具备无缝的网络浏览和信息获取功能。无论是创建新功能、修复错误还是从头开始开发整个项目,Devika都在此助力。

Project Cover

myGPTReader

myGPTReader是一个革新性的AI阅读助手,支持网页、文档和视频内容的智能阅读。用户可以通过语音与其交流,进行多语种对话,有效提高外语水平。此外,它还集成了最新热点新闻的自动摘要功能,使得用户能迅速掌握当下热门话题。加入超过5000名成员的Slack频道,免费体验myGPTReader的全部功能。

Project Cover

VEED

VEED.IO为全球用户提供高效的文本到语音转换,支持多种语言和真实声音选项,适用于内容制作及广告业务,提升视频生产的效率与质量。

Project Cover

TTS

TTS库基于最新研究成果,提供高效的文本到语音生成技术,实现了训练便捷、速度快、质量高的最佳平衡。该库包括预训练模型和数据集质量评估工具,已被广泛应用于20多种语言的产品和研究项目。支持多说话人TTS、快速模型训练、多GPU训练,并兼容PyTorch、TensorFlow和TFLite等多种平台。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号