项目介绍:midi2voice
midi2voice 是一个用于从 MIDI 文件合成歌声的开源项目。该项目依托名古屋工业大学开发的 HMM(隐藏马尔可夫模型)歌声合成系统,使用 sinsy.jp 网站来合成音频。项目的初衷是为 MIDI 文件提供一种便捷的方式,用以生成模拟人声的歌声。
依赖项
midi2voice 项目的运行需要以下依赖:
- musescore,用于将 MIDI 文件转换为 MusicXML 格式。
- Python 3,是项目的运行环境。
安装方法
用户可以通过以下命令安装 midi2voice:
pip install git+git://github.com/mathigatti/midi2voice.git
使用方法
midi2voice 提供一个命令行接口,用户可以通过执行 python -m midi2voice
来运行程序。程序支持多个参数,大多数参数是可选的,只需在默认设置不满足时使用。
python -m midi2voice -h # 显示帮助信息并退出
python -m midi2voice -l 歌词文件路径 -m MIDI文件路径 -lang 语言 -g 性别 -t 节奏 -s 性别参数 -v 颤音强度 -p 音高变调 -d 目标文件夹
以下是使用示例:
-
打印帮助信息:
python3 -m midi2voice -h
-
基础使用示例:
python -m midi2voice -l shallow.txt -m shallow.mid
-
使用特定语言、性别和节奏生成歌声:
python -m midi2voice -l shallow.txt -m shallow.mid -lang english -g female -t 96
对于没有安装 Python 的用户,该项目也可以通过 Google Colab 在线试用:点击这里尝试。
可用的声音选项
目前,sinsy.jp 网站提供多种语言和性别的声音选项。用户可以利用 VOICEINDEX 参数选择不同的声音:
-
日语:
- 女性:Yoko、Xiang-Ling 等(多达 7 种变体)
- 男性:目前有 2 种变体
-
英语:
- 女性:Xiang-Ling(2 种变体)
- 男性:Matsuo-P
-
中文(普通话):
- 女性:Xiang-Ling
贡献与支持
项目由 Mathias Gatti 开发(GitHub 用户名 @mathigatti)。如果用户在学术发表中使用了该项目,请记得注明引用信息:
Gatti, M. (2020). mathigatti/midi2voice v1.0.0 (v1.0.0) [Computer software]. Zenodo. https://doi.org/10.5281/ZENODO.3969003
用户可以通过 ko-fi 支持作者继续开发和维护该开源项目。
开源协议
midi2voice 使用 MIT 开源许可证。用户可以自由使用、修改和分发该软件。