#多语言支持

Speech Dataset Generator: 强大的语音数据集生成工具

3 个月前
Cover of Speech Dataset Generator: 强大的语音数据集生成工具

aTrain: 革新语音转录技术的开源工具

3 个月前
Cover of aTrain: 革新语音转录技术的开源工具

AutoDev VSCode插件:AI驱动的编码助手

3 个月前
Cover of AutoDev VSCode插件:AI驱动的编码助手

AutoDev: 智能驱动的全自动软件开发框架

3 个月前
Cover of AutoDev: 智能驱动的全自动软件开发框架

RealtimeTTS: 实时文本转语音的革新性解决方案

3 个月前
Cover of RealtimeTTS: 实时文本转语音的革新性解决方案

ChatGPT翻译器:AI驱动的多语言翻译新时代

3 个月前
Cover of ChatGPT翻译器:AI驱动的多语言翻译新时代

Transcribe: 智能语音转文字的革命性工具

3 个月前
Cover of Transcribe: 智能语音转文字的革命性工具

YouTube AI Extension: 智能化您的YouTube视频观看体验

3 个月前
Cover of YouTube AI Extension: 智能化您的YouTube视频观看体验

ChatGPT Infinity: 无限对话的AI聊天体验

3 个月前
Cover of ChatGPT Infinity: 无限对话的AI聊天体验

BetterOCR: 融合多个OCR引擎与LLM的文本识别利器

3 个月前
Cover of BetterOCR: 融合多个OCR引擎与LLM的文本识别利器
相关项目
Project Cover

vosk-api

Vosk是一款离线开源语音识别工具包,支持20多种语言和方言。其模型体积小(仅50MB),但能提供连续的大词汇量转录、零延迟响应和流媒体API。支持Python、Java、Node.JS、C#、C++、Rust、Go等多种编程语言。适用于聊天机器人、智能家居设备、虚拟助手,也能为电影创建字幕、为讲座和采访生成转录。Vosk从Raspberry Pi等小型设备到大型集群均可扩展。访问Vosk官网获取安装指南、示例和文档。

Project Cover

ChatGPT-Shortcut

AiShort提供简洁易用的AI提示词,无需了解提示词详情即可通过筛选和搜索找到适合各种场景的选项,提升工作效率。支持多语言优化,一键发送至ChatGPT,轻松收藏、编辑和管理提示词,并通过社区投票系统推荐最佳提示词。兼容多种浏览器,提供详细的部署指南和更新方法,便于用户自定义和分享提示词。

Project Cover

open-webui

Open WebUI是一个为多设备设计的自托管WebUI,支持离线使用,集成LMStudio、GroqCloud等API。支持Docker和Kubernetes安装,提供Markdown、LaTeX支持、多语言翻译、图像生成等功能,并通过角色控制访问权限,定期更新,适用于企业和个人用户。详细信息请访问官方文档。

Project Cover

ChatTTS

ChatTTS是为对话场景特别设计的文本到语音模型,支持多种语言和多发言者交互。该模型优化对话基础任务,支持细粒度的韵律特征控制,如笑声、停顿等。通过使用预训练模型,ChatTTS在自然语言合成和表达能力方面均有突破性进展,适用于教育和研究目的。

Project Cover

OpenVoice

OpenVoice是一款革命性的语音克隆工具,提供准确的音色复制和灵活的声音风格控制,支持多种语言和口音。V2版本进一步强化了音质,并增设了多种母语级支持,包括英语、西班牙语、法语、中文、日语和韩语,并从2024年4月起免费提供商业使用。OpenVoice已广泛应用于即时语音克隆功能,并在全球范围内持续扩展用户群体。

Project Cover

devika

Devika是一款先进的AI软件工程师,能够理解高层次人类指令,并将其分解为步骤,搜索相关信息并编写代码以实现既定目标。该项目支持多种编程语言,集成了大语言模型、高级AI规划和推理能力,并具备无缝的网络浏览和信息获取功能。无论是创建新功能、修复错误还是从头开始开发整个项目,Devika都在此助力。

Project Cover

myGPTReader

myGPTReader是一个革新性的AI阅读助手,支持网页、文档和视频内容的智能阅读。用户可以通过语音与其交流,进行多语种对话,有效提高外语水平。此外,它还集成了最新热点新闻的自动摘要功能,使得用户能迅速掌握当下热门话题。加入超过5000名成员的Slack频道,免费体验myGPTReader的全部功能。

Project Cover

VEED

VEED.IO为全球用户提供高效的文本到语音转换,支持多种语言和真实声音选项,适用于内容制作及广告业务,提升视频生产的效率与质量。

Project Cover

TTS

TTS库基于最新研究成果,提供高效的文本到语音生成技术,实现了训练便捷、速度快、质量高的最佳平衡。该库包括预训练模型和数据集质量评估工具,已被广泛应用于20多种语言的产品和研究项目。支持多说话人TTS、快速模型训练、多GPU训练,并兼容PyTorch、TensorFlow和TFLite等多种平台。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号