epub2tts

将 epub 或文本文件转换为有声读物

epub2tts 文本转语音 Coqui AI TTS 免费开源音频书 Github 开源项目

epub2tts是一个开源Python应用，支持多引擎文本到语音转换，包括Coqui AI TTS、OpenAI和MS Edge，提供自动章节检测、封面嵌入等功能，支持断点续传和语音自定义选项。

Github

介绍相关项目

Audioread - 智能文字转语音工具，提升阅读效率的革新方案

AI工具AI朗读多任务处理播客应用文本转语音移动学习

Audioread是一款智能文字转语音工具，可将文章、PDF和邮件等文本转换为高质量语音。支持多种输入方式，包括网页应用、浏览器扩展和移动应用。用户可通过任何播客应用或浏览器收听内容，体验近似真人朗读的效果。其私人播客RSS订阅功能让用户能在主流播客平台上便捷收听。这一工具旨在帮助专业人士提升效率，实现多任务处理和随时学习。

ChatTTS - 优化对话场景的文本转语音技术，提供自然流畅的语音输出

AI工具ChatTTS人工智能对话系统自然语言处理语音合成

ChatTTS是一种针对对话场景优化的文本转语音模型，适用于聊天机器人和虚拟助手等应用。该模型支持英语和中文，通过大规模数据训练，生成自然、富有表现力的语音输出。ChatTTS具备多说话人支持、精细控制和优秀韵律等特点，能够实现逼真的交互式对话。开源版本提供40,000小时预训练模型，适合研究和开发。此模型在对话场景中表现突出，有助于提升语音交互的自然度和生动性。

ekho - 专为视障人士设计的中文文本转语音引擎

EkhoGithubeGuideDog中文TTS声音文件开源项目语音合成

Ekho是一个开源的中文文本转语音工具，属于eGuideDog项目。它旨在帮助视障人士更好地获取信息，支持普通话语音输出，并允许用户自定义或更新语音数据，以提高听觉体验的流畅性和准确性。

PDFToMP3 - AI驱动的PDF转音频工具助力高效学习

AI工具AI技术PDF转MP3内容简化移动学习音频学习

PDFToMP3是一款创新的PDF转MP3在线工具，利用AI文本转语音技术将PDF文档转换为易听的音频文件。它能简化复杂内容，包括数学公式，使之适合听觉学习。每个章节都附有简洁总结，加深理解。用户可在通勤、锻炼或做家务时进行移动学习，保持知识更新。这种高效、灵活的学习方式特别适合忙碌的专业人士和学生，帮助他们在各自领域保持领先地位。

WhisperSpeech - 多语言支持的开源文本转语音系统，功能强大并易于定制

GithubWhisperSpeech多语言支持开源模型开源项目文本转语音语音克隆

WhisperSpeech是基于开源Whisper框架开发的文本至语音系统，提供了商业级安全的语音合成解决方案。当前支持英语LibreLight数据集，并计划拓展到多语言支持。用户可通过在线Colab平台体验其高效的语音合成和声音克隆功能。

tortoise - 全新世代的多声音文本转语音技术，具备高度真实的语调和韵律

GitHubGithubHugging FaceTortoise TTS多声部能力开源项目文本转语音热门

Tortoise TTS 是一款先进的文本转语音软件，专为提供多声音功能和高度真实的语调与韵律设计。该项目支持各种安装方式，包括pip和Docker，并提供了完善的本地安装指南。此外，Tortoise TTS 还在Hugging Face上提供在线演示，用户可体验其强大功能。它使用了自回归解码器和扩散解码器，大幅提升了语音生成的速度和质量。无论是个人用户还是开发者，都可通过详细的使用指南迅速上手和部署。

MeloTTS-Chinese - 开源多语言文本转语音系统，支持CPU实时推理

GithubHuggingfaceMeloTTSMyShell.ai多语言支持开源项目文本转语音模型语音合成

MeloTTS是一个开源的多语言文本转语音系统，支持英语（含美式、英式等多种口音）、西班牙语、法语、中文、日语和韩语。其特色功能包括混合中英文处理和CPU实时推理。项目提供Python接口，便于开发者集成。MeloTTS采用MIT许可证，允许商业和非商业使用。

ChatTTS-ui - 多语种文字语音合成工具，支持中英数字混合及本地API接入

API接口CUDA加速ChatTTSGithubffmpeg开源项目语音合成

ChatTTS-webUI为用户提供文字到语音合成服务，支持中英文及数字，可本地运行或通过API接入。采用GPU加速优化处理速度，适合个人及企业使用，提供多种部署方案。

Cognitive-Speech-TTS - 高效文本转语音解决方案，支持个性化声音定制

Azure AIAzure Cognitive ServicesGithubMicrosoftSpeech SDKText-to-Speech开源项目

Azure Cognitive Service的TTS技术支持高效的文本转语音转换，提供多语言、多情感和个性化声音定制。通过REST API和Speech SDK集成，提供跨平台解决方案，应用广泛，包括教育、媒体、娱乐和医疗等领域。最新更新及客户案例展示了Azure AI推动的创新及优质用户体验。

Speechki - 多语种AI语音生成和文本转语音平台

AI工具AI语音合成Speechki内容创作工具多语言支持文字转语音

Speechki是一个AI驱动的语音生成平台，支持1100多种声音和80多种语言。该工具可将文本转换为高质量音频，适合各类用户使用。具备实时校听、章节格式化、角色管理和精确停顿控制等功能，便于创建专业音频内容。支持多语言和多播放，有助于拓展全球受众。Speechki为用户提供了强大的文本转语音解决方案。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com