tts-server-android

TTS工具，支持自定义引擎和多语言识别

TTS Server 微软接口朗读规则 Azure Android Studio Github 开源项目

tts-server-android是一个优化网络朗读需求的APP，内置微软接口，支持自定义HTTP请求和本地TTS引擎导入。该项目提供中文双引号旁白/对话识别朗读、自动重试、备用配置和文本替换等功能。用户可以通过界面添加和导入朗读规则并设置变量。该项目集成了多种开源资源和工具，保证了应用的稳定性和灵活性，适合需要提升阅读体验的用户。

访问官网

Github

介绍相关项目

epub_to_audiobook - EPUB电子书转换为有声读物工具，支持Azure和OpenAI TTS技术

AudiobookshelfAzure TTSEPUB to AudiobookGithubOpenAI TTSText-to-Speech开源项目

epub_to_audiobook是一个开源的命令行程序，能够把EPUB电子书转换为有声读物。利用Microsoft Azure和OpenAI的TTS API，为每章节产生高质量的音频文件，完美适配Audiobookshelf。提供Edge TTS支持，无需API密钥即可操作。

Audioread - 智能文字转语音工具，提升阅读效率的革新方案

AI工具AI朗读多任务处理播客应用文本转语音移动学习

Audioread是一款智能文字转语音工具，可将文章、PDF和邮件等文本转换为高质量语音。支持多种输入方式，包括网页应用、浏览器扩展和移动应用。用户可通过任何播客应用或浏览器收听内容，体验近似真人朗读的效果。其私人播客RSS订阅功能让用户能在主流播客平台上便捷收听。这一工具旨在帮助专业人士提升效率，实现多任务处理和随时学习。

Talkify - 多语言支持的高品质文字转语音库

API密钥GithubTalkify多语言支持开源项目文本转语音高品质声音

Talkify为多语言环境提供高品质的文字转语音服务。该库支持范围广泛的语言，包括中文和英文，便于开发者通过几个简单步骤集成至任何网站。具有全面的API支持和控制界面，每月初次1000次请求免费。立即注册以体验先进的语音合成服务。

Transformer-TTS - 神经语音合成系统

GithubPyTorchTacotronTransformer-TTS开源项目神经网络语音合成

Transformer-TTS，一个基于Pytorch的高效神经语音合成系统。它使用Transformer网络，且训练速度是传统seq2seq模型的3到4倍。不仅提供预训练模型，其合成语音质量经实验证明优异。同时，项目支持自定义学习模型及策略，包括Noam式预热衰减学习率及关键的梯度裁剪等，是语音合成研究的理想选择。

xtts-webui - 用于使用 XTTS 并对其进行微调的 Webui

GithubXTTS-WebUI便携版本开源项目模型微调神经网络语音合成

XTTS-WebUI是一个强大的语音合成界面，利用先进的XTTS技术，支持无需安装的便携式版本，能够处理批量文件，维持翻译语音的原真性，并通过神经网络自动优化语音合成结果。此外，用户还可以自定义调整语音模型，实现无需深度学习背景即可操作的专业语音处理。

LangHelper - 多语言对话、发音评分及语音合成工具

AI发音ChatGPTGithubLangHelper发音评分开源项目语音识别

LangHelper提供多种口音的AI语音对话、双语识别技术，以及针对IELTS/TOEFL考试的发音评分服务。用户可以模拟与名人对话或加载个性化TTS模型进行特定发音训练，同时支持espeak-ng等开源语音库。支持免安装使用，简化语音实践与评估流程。

edge-tts - 模块精确支持多语言文本转语音功能，且具备声音自定义调整。

GithubMicrosoft EdgePython模块edge-tts命令行开源项目文本转语音

edge-tts作为一个基于Python的模块，利用Microsoft Edge的在线服务实现文本到语音的转换。支持丰富的语音和语言选项，并允许用户调整语速、音量和音调，适合于各类文本至语音的转换需求。此模块有效简化语音合成流程，提升开发效率。

Speechson - 在线多语言文本转语音服务

AI工具AI语音生成SSML功能Speechson多语言支持文字转语音

Speechson是一个在线文本转语音平台，提供840多种AI语音和135多种语言方言。支持MP3、OGG、WAV和WEBM等音频格式输出。借助深度学习技术，生成高质量、自然的语音。平台支持SSML功能，方便调整语音特性。适用于教育培训、内容创作等多种场景，能够满足多样化的语音需求。

NaturalReader Home - AI文本转语音、语音克隆、多语言语音生成

AI工具AI语音合成AI音频LLM AI声音NaturalReader多语言支持热门语音克隆音频生成

NaturalReader是一个专业文本到语音平台，涵盖50种语言和200种AI语音，支持PDF等20多种格式。运用先进的大型语言模型（Large Language Models, LLM）技术，提供高质量的声音克隆和声音生成，广泛应用于教育、商业和增强无障碍通讯。

GPT-SoVITS-Server - 轻量级语音克隆模型部署工具

GPT-SoVITSGithub开源项目推理合成服务器部署模型训练语音克隆

GPT-SoVITS-Server是一个简化语音克隆模型部署的轻量级项目。无需复杂环境搭建，用户可在多种设备上轻松运行训练好的GPT-SoVITS模型，包括手机和服务器。项目适用于CPU推理，提供简化的代码结构和配置选项，便于新手使用。未来计划包括优化代码结构、增加语言支持和开发图形界面。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号