#多语言支持

Speech Dataset Generator: 强大的语音数据集生成工具

3 个月前

Speech Dataset Generator 音频处理数据集生成语音识别多语言支持 Github 开源项目

3 个月前

aTrain: 革新语音转录技术的开源工具

3 个月前

aTrain 语音转录机器学习隐私保护多语言支持 Github 开源项目

3 个月前

AutoDev VSCode插件:AI驱动的编码助手

3 个月前

AutoDev VSCode插件 AI编程助手代码生成多语言支持 Github 开源项目

3 个月前

AutoDev: 智能驱动的全自动软件开发框架

3 个月前

AutoDev AI Intellij 自动代码生成多语言支持 Github 开源项目

3 个月前

RealtimeTTS: 实时文本转语音的革新性解决方案

3 个月前

多引擎支持多语言支持 Github 开源项目 RealtimeTTS 低延迟高质量音频

3 个月前

ChatGPT翻译器：AI驱动的多语言翻译新时代

3 个月前

ChatGPT Translator 翻译开源多语言支持桌面应用 Github 开源项目

3 个月前

Transcribe: 智能语音转文字的革命性工具

3 个月前

Transcribe OpenAI 实时转录多语言支持安全功能 Github 开源项目

3 个月前

YouTube AI Extension: 智能化您的YouTube视频观看体验

3 个月前

YouTube AI Extension 视频聊天多语言支持实时互动用户界面 Github 开源项目

3 个月前

ChatGPT Infinity: 无限对话的AI聊天体验

3 个月前

ChatGPT Infinity 多语言支持自定义主题选择可调节响应间隔自动滚动 Github 开源项目

3 个月前

BetterOCR: 融合多个OCR引擎与LLM的文本识别利器

3 个月前

BetterOCR OCR引擎 LLM 文本检测多语言支持 Github 开源项目

3 个月前

相关项目

vosk-api

Vosk是一款离线开源语音识别工具包，支持20多种语言和方言。其模型体积小（仅50MB），但能提供连续的大词汇量转录、零延迟响应和流媒体API。支持Python、Java、Node.JS、C#、C++、Rust、Go等多种编程语言。适用于聊天机器人、智能家居设备、虚拟助手，也能为电影创建字幕、为讲座和采访生成转录。Vosk从Raspberry Pi等小型设备到大型集群均可扩展。访问Vosk官网获取安装指南、示例和文档。

ChatGPT-Shortcut

AiShort提供简洁易用的AI提示词，无需了解提示词详情即可通过筛选和搜索找到适合各种场景的选项，提升工作效率。支持多语言优化，一键发送至ChatGPT，轻松收藏、编辑和管理提示词，并通过社区投票系统推荐最佳提示词。兼容多种浏览器，提供详细的部署指南和更新方法，便于用户自定义和分享提示词。

open-webui

Open WebUI是一个为多设备设计的自托管WebUI，支持离线使用，集成LMStudio、GroqCloud等API。支持Docker和Kubernetes安装，提供Markdown、LaTeX支持、多语言翻译、图像生成等功能，并通过角色控制访问权限，定期更新，适用于企业和个人用户。详细信息请访问官方文档。

ChatTTS

ChatTTS是为对话场景特别设计的文本到语音模型，支持多种语言和多发言者交互。该模型优化对话基础任务，支持细粒度的韵律特征控制，如笑声、停顿等。通过使用预训练模型，ChatTTS在自然语言合成和表达能力方面均有突破性进展，适用于教育和研究目的。

OpenVoice

OpenVoice是一款革命性的语音克隆工具，提供准确的音色复制和灵活的声音风格控制，支持多种语言和口音。V2版本进一步强化了音质，并增设了多种母语级支持，包括英语、西班牙语、法语、中文、日语和韩语，并从2024年4月起免费提供商业使用。OpenVoice已广泛应用于即时语音克隆功能，并在全球范围内持续扩展用户群体。

devika

Devika是一款先进的AI软件工程师，能够理解高层次人类指令，并将其分解为步骤，搜索相关信息并编写代码以实现既定目标。该项目支持多种编程语言，集成了大语言模型、高级AI规划和推理能力，并具备无缝的网络浏览和信息获取功能。无论是创建新功能、修复错误还是从头开始开发整个项目，Devika都在此助力。

myGPTReader

myGPTReader是一个革新性的AI阅读助手，支持网页、文档和视频内容的智能阅读。用户可以通过语音与其交流，进行多语种对话，有效提高外语水平。此外，它还集成了最新热点新闻的自动摘要功能，使得用户能迅速掌握当下热门话题。加入超过5000名成员的Slack频道，免费体验myGPTReader的全部功能。

VEED

VEED.IO为全球用户提供高效的文本到语音转换，支持多种语言和真实声音选项，适用于内容制作及广告业务，提升视频生产的效率与质量。

TTS

TTS库基于最新研究成果，提供高效的文本到语音生成技术，实现了训练便捷、速度快、质量高的最佳平衡。该库包括预训练模型和数据集质量评估工具，已被广泛应用于20多种语言的产品和研究项目。支持多说话人TTS、快速模型训练、多GPU训练，并兼容PyTorch、TensorFlow和TFLite等多种平台。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com