funaudiollm-app 仓库
欢迎来到 funaudiollm-app 仓库!本项目包含两个令人兴奋的应用,它们利用先进的音频理解和语音生成模型,为您的音频体验带来生机:
语音聊天:该应用旨在提供互动自然的聊天体验,使在各种场景中采用复杂的人工智能对话变得更加容易。
语音翻译:使用我们的实时语音翻译工具打破语言障碍。该应用可以即时无缝地翻译口语,让不同语言的使用者之间进行有效流畅的交流。
欲了解详情,请访问 FunAudioLLM 主页、CosyVoice 论文、FunAudioLLM 技术报告
关于 CosyVoice
,请访问 CosyVoice 仓库 和 CosyVoice 空间。
关于 SenseVoice
,请访问 SenseVoice 仓库 和 SenseVoice 空间。
安装
克隆和安装
- 克隆仓库和子模块
git clone --recursive URL
# 如果由于网络故障导致克隆子模块失败,请重复运行以下命令直到成功
cd funaudiollm-app
git submodule update --init --recursive
-
根据 cosyvoice 和 sensevoice 仓库的说明在子模块中准备环境。如果您已经在其他地方准备好了上述资源,也可以尝试修改 app.py 文件中与资源路径配置相关的代码(第 15-18 行)。
-
执行以下代码。
pip install -r requirements.txt
基本用法
准备工作
dashscope API 令牌。
语音聊天
cd voice_chat
sudo CUDA_VISIBLE_DEVICES="0" DS_API_TOKEN="您的-DS-API-令牌" python app.py >> ./log.txt
语音翻译
cd voice_translation
sudo CUDA_VISIBLE_DEVICES="0" DS_API_TOKEN="您的-DS-API-令牌" python app.py >> ./log.txt