#图像提示
相关项目
ru-dalle
ru-dalle是一个开源的图像生成工具,能够将文本描述转换成详细的图像。采用预训练模型,支持多种风格,包括Malevich、Emojich等,适用于多种应用场景,如艺术设计、内容创作等。该项目提供易于使用的API,允许用户快速生成高分辨率图像,并支持图片微调和超分辨率处理,使图像更加精细和真实。
IP-Adapter
IP-Adapter是一款轻量高效的图像提示适配器,仅需22M参数即可为预训练文本到图像扩散模型提供图像提示功能。它不仅性能卓越,还可泛化到其他自定义模型,与现有控制工具兼容实现可控生成。IP-Adapter支持图像和文本提示配合使用,实现多模态图像生成,为AI图像生成领域带来新的可能性。
VideoBooth
VideoBooth是一个AI视频生成项目,利用扩散模型技术基于图像提示创建视频。该项目将静态图像主体转化为动态视频,实现图像到视频的转换。VideoBooth采用两阶段训练方法,提供安装、推理和训练指南。项目还公开了专门数据集,为研究提供资源。
ImageDream
ImageDream是一个从单一2D图像输入生成逼真3D内容的开源项目。它结合图像提示和多视角扩散技术创建高质量3D模型,支持软阴影渲染,并提供简便的配置和安装指南。该项目展示了图像引导3D生成的最新应用,为计算机视觉和图形学研究提供了新的实验平台。