#CUDA加速

stt - 高效离线本地语音识别工具，基于fast-whisper模型，支持多种输出格式

语音识别fast-whisper本地部署CUDA加速文本输出Github开源项目热门

这款语音识别工具可在本地离线运行，基于开源的fast-whisper模型，可将视频和音频中的人声快速转换为文字。支持输出json、srt及纯文本格式，无需联网，确保隐私安全，与openai语音识别接口准确率相当。用户可便捷下载预编译版本，或自行部署源码，支持多种操作系统。此外，还提供API接口，适合开发者使用。支持CUDA加速，优化处理速度。

clone-voice - 多语种语音克隆工具支持16种语言

声音克隆工具多语言支持CUDA加速模型下载音频转换Github开源项目

clone-voice是一款支持16种语言的声音克隆工具，能将文字转换为语音或修改语音音色。具有易用的Web界面，无需高性能硬件即可使用，适用于教育和娱乐等多种用途。提供自然的合成效果，并支持在线录音功能。

ChatTTS-ui - 多语种文字语音合成工具，支持中英数字混合及本地API接入

ChatTTS语音合成API接口CUDA加速ffmpegGithub开源项目

ChatTTS-webUI为用户提供文字到语音合成服务，支持中英文及数字，可本地运行或通过API接入。采用GPU加速优化处理速度，适合个人及企业使用，提供多种部署方案。

gsplat - 开源CUDA加速3D高斯渲染库

gsplat高斯散射CUDA加速3D渲染图形库Github开源项目

gsplat是一个基于CUDA的开源高斯渲染库,支持Python接口。该库利用3D高斯分布实现实时辐射场渲染,性能优于原始论文实现。gsplat可应用于3D高斯模型训练、2D图像拟合和大规模场景实时渲染。库提供PyPI和源码安装方式,包含多个示例和基准测试。项目持续改进中,欢迎开发者参与贡献。

相关文章

Article Cover

STT: 离线语音识别转文字工具

Article Cover

AI声音克隆技术：打造个性化语音体验的新时代

Article Cover

ChatTTS-ui: 一个简单强大的本地文字转语音工具

Article Cover

gsplat: 高效的3D高斯体渲染库

Article Cover

STT语音识别转文字工具 - 离线运行的本地语音识别服务

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号