#多语言支持

AIGODLIKE-ComfyUI-Translation: 为ComfyUI打造的多语言翻译插件

3 个月前
Cover of AIGODLIKE-ComfyUI-Translation: 为ComfyUI打造的多语言翻译插件

Chenyme-AAVT:一款功能强大的全自动视频翻译工具

3 个月前
Cover of Chenyme-AAVT:一款功能强大的全自动视频翻译工具

Reactive Resume: 开源免费、保护隐私的简历构建工具

3 个月前
Cover of Reactive Resume: 开源免费、保护隐私的简历构建工具

USearch: 高性能向量搜索与聚类引擎

3 个月前
Cover of USearch: 高性能向量搜索与聚类引擎

AIGODLIKE-ComfyUI-Translation: 一个强大的ComfyUI多语言翻译插件

3 个月前
Cover of AIGODLIKE-ComfyUI-Translation: 一个强大的ComfyUI多语言翻译插件

Chenyme-AAVT:一站式视频音频自动化翻译工具

3 个月前
Cover of Chenyme-AAVT:一站式视频音频自动化翻译工具

Reactive Resume: 革新你的简历制作体验

3 个月前
Cover of Reactive Resume: 革新你的简历制作体验

Qwen2-Audio:最新的大规模音频-语言模型

3 个月前
Cover of Qwen2-Audio:最新的大规模音频-语言模型

TTTS: 下一代文本转语音系统的训练框架

3 个月前
Cover of TTTS: 下一代文本转语音系统的训练框架

Coqui TTS: 强大的开源文本转语音工具包

3 个月前
Cover of Coqui TTS: 强大的开源文本转语音工具包
相关项目
Project Cover

vosk-api

Vosk是一款离线开源语音识别工具包,支持20多种语言和方言。其模型体积小(仅50MB),但能提供连续的大词汇量转录、零延迟响应和流媒体API。支持Python、Java、Node.JS、C#、C++、Rust、Go等多种编程语言。适用于聊天机器人、智能家居设备、虚拟助手,也能为电影创建字幕、为讲座和采访生成转录。Vosk从Raspberry Pi等小型设备到大型集群均可扩展。访问Vosk官网获取安装指南、示例和文档。

Project Cover

ChatGPT-Shortcut

AiShort提供简洁易用的AI提示词,无需了解提示词详情即可通过筛选和搜索找到适合各种场景的选项,提升工作效率。支持多语言优化,一键发送至ChatGPT,轻松收藏、编辑和管理提示词,并通过社区投票系统推荐最佳提示词。兼容多种浏览器,提供详细的部署指南和更新方法,便于用户自定义和分享提示词。

Project Cover

open-webui

Open WebUI是一个为多设备设计的自托管WebUI,支持离线使用,集成LMStudio、GroqCloud等API。支持Docker和Kubernetes安装,提供Markdown、LaTeX支持、多语言翻译、图像生成等功能,并通过角色控制访问权限,定期更新,适用于企业和个人用户。详细信息请访问官方文档。

Project Cover

ChatTTS

ChatTTS是为对话场景特别设计的文本到语音模型,支持多种语言和多发言者交互。该模型优化对话基础任务,支持细粒度的韵律特征控制,如笑声、停顿等。通过使用预训练模型,ChatTTS在自然语言合成和表达能力方面均有突破性进展,适用于教育和研究目的。

Project Cover

OpenVoice

OpenVoice是一款革命性的语音克隆工具,提供准确的音色复制和灵活的声音风格控制,支持多种语言和口音。V2版本进一步强化了音质,并增设了多种母语级支持,包括英语、西班牙语、法语、中文、日语和韩语,并从2024年4月起免费提供商业使用。OpenVoice已广泛应用于即时语音克隆功能,并在全球范围内持续扩展用户群体。

Project Cover

devika

Devika是一款先进的AI软件工程师,能够理解高层次人类指令,并将其分解为步骤,搜索相关信息并编写代码以实现既定目标。该项目支持多种编程语言,集成了大语言模型、高级AI规划和推理能力,并具备无缝的网络浏览和信息获取功能。无论是创建新功能、修复错误还是从头开始开发整个项目,Devika都在此助力。

Project Cover

myGPTReader

myGPTReader是一个革新性的AI阅读助手,支持网页、文档和视频内容的智能阅读。用户可以通过语音与其交流,进行多语种对话,有效提高外语水平。此外,它还集成了最新热点新闻的自动摘要功能,使得用户能迅速掌握当下热门话题。加入超过5000名成员的Slack频道,免费体验myGPTReader的全部功能。

Project Cover

VEED

VEED.IO为全球用户提供高效的文本到语音转换,支持多种语言和真实声音选项,适用于内容制作及广告业务,提升视频生产的效率与质量。

Project Cover

TTS

TTS库基于最新研究成果,提供高效的文本到语音生成技术,实现了训练便捷、速度快、质量高的最佳平衡。该库包括预训练模型和数据集质量评估工具,已被广泛应用于20多种语言的产品和研究项目。支持多说话人TTS、快速模型训练、多GPU训练,并兼容PyTorch、TensorFlow和TFLite等多种平台。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号