#图像条件生成
shap-e - 基于文本和图像生成创意3D模型的开源工具
Shap-E3D模型生成文本条件生成图像条件生成深度学习Github开源项目
Shap-E是一个开源的3D模型生成工具,能够基于文本描述或图像输入创建独特的3D模型。项目提供了官方代码和预训练模型,支持文本到3D和图像到3D的转换。用户可通过pip轻松安装,并使用Jupyter notebooks快速上手。Shap-E展示了强大的创意能力,如根据'看起来像鳄梨的椅子'等提示生成相应的3D模型。
Michelangelo - 新型3D形状生成技术,形状-图像-文本对齐方法
Michelangelo3D形状生成图像条件生成文本条件生成多模态对齐Github开源项目
Michelangelo项目提出'先对齐后生成'方法,解决2D图像或文本生成3D形状的难题。通过形状-图像-文本对齐空间,该技术缩小了不同模态间的差距。项目核心包括SITA-VAE模型(用于3D形状编码和重建)和ASLDM模型(学习多模态到形状空间的映射)。实验结果显示,这种方法能生成质量更高、多样性更强、且与输入条件语义一致性更好的3D形状。