#文字转语音

ollama-voice - 离线语音交互AI助手集成语音识别对话和合成功能

ollama-voice语音识别大型语言模型文字转语音离线模式Github开源项目

ollama-voice是一个集成Whisper语音识别、Ollama大语言模型和pyttsx3文本转语音技术的开源项目。它创建了一个完全离线的语音交互AI助手，支持本地语音识别、自然语言处理和语音合成。用户通过按住空格键即可与AI对话，适用于需要隐私保护或离线环境的语音交互场景。

pyht - 将文本实时转换为高质量人声音频的Python SDK

PlayHT文字转语音Python SDKAPI语音合成Github开源项目

pyht是基于PlayHT文本转语音API的Python SDK，能将文本实时转换为高质量人声音频流。该SDK支持预建和自定义声音，兼容WAV、MP3等多种音频格式。pyht安装简便，提供API接口和命令行演示，适用于虚拟助手、有声读物和无障碍服务等多种应用场景。此SDK需要Python 3.8+环境，依赖numpy和simpleaudio库。用户可通过pip快速安装，使用时需提供PlayHT的用户ID和API密钥。pyht提供了流式文本转语音功能，支持实时音频生成，为开发者提供了灵活的文本转语音解决方案。

vixtts-demo - 专注越南语的开源文本转语音工具

viXTTS文字转语音语音克隆越南语Hugging FaceGithub开源项目

viXTTS是一个开源的文本转语音工具，基于XTTS-v2.0.3模型，主要针对越南语进行优化。该工具使用viVoice数据集微调，支持高质量声音克隆。用户可通过Hugging Face在线体验或在本地Ubuntu/WSL2系统运行。虽然重点优化越南语，但也支持其他语言尝试。项目提供详细的安装和使用说明，便于研究者和开发者使用。

pyttsx3 - 跨平台Python离线文本转语音库，支持多系统的TTS工具

pyttsx3文字转语音Python库离线语音合成语音控制Github开源项目

pyttsx3是一款功能丰富的Python文本转语音库，支持离线运行。该库允许调整语音速率、音量，并选择系统内置语音。通过简洁的API，用户可轻松实现文本到语音的转换，还能将语音保存为音频文件。pyttsx3兼容Windows、Mac和Linux等多个平台，适用于各类语音应用开发。

mms-tts-eng - Facebook开源英语文本转语音AI模型

模型MMS多语言语音英语开源项目Huggingface文字转语音GithubVITS

Facebook开发的MMS项目推出英语文本转语音模型，采用VITS架构实现高质量语音合成。该开源模型可通过Hugging Face Transformers库调用，支持非确定性合成以生成富有表现力的语音。作为多语言语音技术项目的一部分，此模型旨在推动语音合成技术在更多语言中的应用。

MeloTTS-Korean - 开源多语言文本转语音库实现实时CPU推理

Huggingface模型Github文字转语音开源项目多语言支持实时推理MeloTTS

MeloTTS是一款开源的多语言文本转语音库，支持多种语言和口音，包括英语（美式、英式、印度、澳大利亚）、西班牙语、法语、中文、日语和韩语。该库具备混合中英文处理和CPU实时推理能力，用户可通过Python代码或在线演示使用。MeloTTS采用MIT许可证，鼓励社区参与和贡献。

MeloTTS-English-v3 - 多语言实时文本转语音系统支持CPU推理

MeloTTS模型多语言支持开源项目Huggingface实时推理文字转语音Github

MeloTTS-English-v3是一个多语言文本转语音系统，支持多种语言和口音，包括美式、英式、印度式和澳大利亚式英语，以及西班牙语、法语、中文、日语和韩语。该项目特点包括混合中英文支持和CPU实时推理能力。用户可通过Python代码或MyShell平台使用MeloTTS。项目采用MIT许可证，开源社区可自由贡献。

MeloTTS-Spanish - 基于CPU实时推理的多语言文本转语音系统

语音合成文字转语音开源项目模型人工智能Huggingface多语言支持MeloTTSGithub

MeloTTS是一个开源的多语言文本转语音框架，支持英语(含美式、英式、印度、澳洲变体)、西班牙语、法语、中文、日语和韩语等语言转换。系统可在CPU环境下实现实时推理，其中中文模型支持中英混合输入。该框架提供Hugging Face在线体验和本地部署方案，采用MIT许可证发布。

相关文章

Article Cover

TTS Voice Wizard: 为每个人提供声音的革命性应用

Article Cover

Whisper-TikTok: AI驱动的TikTok视频创作工具

Article Cover

pyttsx3: Python文本转语音库的全面指南

Article Cover

viXTTS：革新越南语文本转语音技术的开源项目

Article Cover

pyht: PlayHT的Python SDK - AI文本转语音流式处理与声音克隆API

Article Cover

TTS-Voice-Wizard 学习资料汇总 - 免费开源的语音转文字和文字转语音应用

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号