#CUDA加速
stt - 高效离线本地语音识别工具,基于fast-whisper模型,支持多种输出格式
语音识别fast-whisper本地部署CUDA加速文本输出Github开源项目热门
这款语音识别工具可在本地离线运行,基于开源的fast-whisper模型,可将视频和音频中的人声快速转换为文字。支持输出json、srt及纯文本格式,无需联网,确保隐私安全,与openai语音识别接口准确率相当。用户可便捷下载预编译版本,或自行部署源码,支持多种操作系统。此外,还提供API接口,适合开发者使用。支持CUDA加速,优化处理速度。
clone-voice - 多语种语音克隆工具支持16种语言
声音克隆工具多语言支持CUDA加速模型下载音频转换Github开源项目
clone-voice是一款支持16种语言的声音克隆工具,能将文字转换为语音或修改语音音色。具有易用的Web界面,无需高性能硬件即可使用,适用于教育和娱乐等多种用途。提供自然的合成效果,并支持在线录音功能。
ChatTTS-ui - 多语种文字语音合成工具,支持中英数字混合及本地API接入
ChatTTS语音合成API接口CUDA加速ffmpegGithub开源项目
ChatTTS-webUI为用户提供文字到语音合成服务,支持中英文及数字,可本地运行或通过API接入。采用GPU加速优化处理速度,适合个人及企业使用,提供多种部署方案。
gsplat - 开源CUDA加速3D高斯渲染库
gsplat高斯散射CUDA加速3D渲染图形库Github开源项目
gsplat是一个基于CUDA的开源高斯渲染库,支持Python接口。该库利用3D高斯分布实现实时辐射场渲染,性能优于原始论文实现。gsplat可应用于3D高斯模型训练、2D图像拟合和大规模场景实时渲染。库提供PyPI和源码安装方式,包含多个示例和基准测试。项目持续改进中,欢迎开发者参与贡献。
相关文章