#高保真

HiFi-GAN入门学习资料汇总 - 高效高保真语音合成模型

2 个月前

HiFi-GAN 语音合成生成对抗网络高保真效率 Github 开源项目

2 个月前

AudioDec: 开源高保真流式神经音频编解码器

3 个月前

AudioDec 神经音频编解码器流式传输高保真开源 Github 开源项目

3 个月前

Make-It-3D: 从单张图像创建高保真3D内容的突破性技术

3 个月前

Make-It-3D 3D重建单张图像高保真 ICCV 2023 Github 开源项目

3 个月前

Unique3D: 从单一图像高效生成高质量3D网格模型

3 个月前

Unique3D 3D网格生成高保真单视图快速实现 Github 开源项目

3 个月前

Instant-Angelo: 20分钟内构建高保真数字孪生的革命性技术

3 个月前

Instant-angelo 高保真 3D重建 COLMAP 快速重建 Github 开源项目

3 个月前

GeneFace: 新一代高保真度音频驱动3D人脸生成技术

3 个月前

GeneFace 高保真音频驱动 3D人脸合成 ICLR'23 Github 开源项目

3 个月前

HiFi-GAN: 高效高保真语音合成的新突破

3 个月前

HiFi-GAN 语音合成生成对抗网络高保真效率 Github 开源项目

3 个月前

相关项目

hifi-gan

HiFi-GAN是一个开源项目，基于GAN技术，提供高保真且高效的语音合成解决方案。它不仅提供预训练模型，还能适应多种语音数据集，并支持灵活的配置选项。欢迎访问官方演示网站体验语音样本。

Instant-angelo

Instant-angelo项目旨在在20分钟内实现高保真的数字孪生三维重建，特别适合移动设备捕获的RGB视频。通过使用UniSDF等技术，能够逼真地重建反射物体。项目支持平滑和细节重建模式，分别适用于简单和复杂表面。提供详细的安装和数据准备指南，并支持自定义数据集。了解如何高效地完成高质量神经表面的重建，体验快速稳定的三维模型生成。

GeneFace

该项目展示了一种通用且高保真的音频驱动3D说话面部生成方法。GeneFace 实现了更好的唇同步和面部表现，即使在非典型音频中也是如此。项目附带预训练模型和数据集，方便快速上手，并支持使用个人视频训练独特的GeneFace模型。新发布的GeneFace++ 提升了唇同步、视频质量和系统效率，具备实时推断和更快的深度3D重建功能。

Unique3D

Unique3D可以从单张图片快速生成高质量的3D网格，支持多种平台的演示，包括Gradio和Huggingface。该项目正在不断更新，提供Windows和Docker安装支持，未来将推出更稳定的重建功能和训练代码。加入社区了解最新进展和合作机会。

Make-It-3D

Make-It-3D项目利用训练良好的2D扩散模型，从单个图像生成高质量3D内容。方法采用两阶段优化流程，先优化神经辐射场整合正视图和新视角的扩散先验，后将粗略模型转化为纹理点云并提升现实感。实验显示，该方法在视觉质量和重建准确性上大幅领先，并支持文本到3D创建和纹理编辑等应用。

AudioDec

AudioDec项目开发了一种流式高保真神经音频编解码器，可以12.8 kbps的比特率处理48 kHz单声道语音。该编解码器在GPU上解码延迟约6毫秒，CPU上约10毫秒。项目采用两阶段训练方法，利用预训练模型可快速为新应用训练编码器。AudioDec在压缩率、延迟和重建质量方面均表现优异，适用于实时通信等场景。

FabricDiffusion

FabricDiffusion可从2D服装图像中提取高质量纹理，并将其无失真地应用于各种形状的3D服装。通过去除输入纹理中的扭曲，该模型生成平面纹理图，并在各种光照条件下实现真实服装效果。经过合成数据训练，这种方法在真实世界应用中展现出优于现有技术的显著性能。

FabricDiffusion

FabricDiffusion提供了一种从二维服装图像到三维服装的纹理和印花转移解决方案，专注于高质量和无损转移。通过物理渲染材质实现多种光照下的真实效果，该方法利用合成数据集训练的扩散模型，有效提升纹理细节捕捉，适用于真实场景，并优于当前方法。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com