#图像提示

ru-dalle - 文本生成图像工具
ruDALL-E生成图像预训练模型超分辨率图像提示Github开源项目
ru-dalle是一个开源的图像生成工具,能够将文本描述转换成详细的图像。采用预训练模型,支持多种风格,包括Malevich、Emojich等,适用于多种应用场景,如艺术设计、内容创作等。该项目提供易于使用的API,允许用户快速生成高分辨率图像,并支持图片微调和超分辨率处理,使图像更加精细和真实。
IP-Adapter - 轻量级图像提示适配器提升文图生成效果
IP-Adapter文本到图像生成扩散模型图像提示多模态生成Github开源项目
IP-Adapter是一款轻量高效的图像提示适配器,仅需22M参数即可为预训练文本到图像扩散模型提供图像提示功能。它不仅性能卓越,还可泛化到其他自定义模型,与现有控制工具兼容实现可控生成。IP-Adapter支持图像和文本提示配合使用,实现多模态图像生成,为AI图像生成领域带来新的可能性。
VideoBooth - 基于图像提示的AI视频生成新突破
VideoBooth视频生成图像提示扩散模型人工智能Github开源项目
VideoBooth是一个AI视频生成项目,利用扩散模型技术基于图像提示创建视频。该项目将静态图像主体转化为动态视频,实现图像到视频的转换。VideoBooth采用两阶段训练方法,提供安装、推理和训练指南。项目还公开了专门数据集,为研究提供资源。
ImageDream - 利用图像提示的多视角扩散方法实现创新3D内容生成
ImageDream三维生成图像提示多视图扩散人工智能Github开源项目
ImageDream是一个从单一2D图像输入生成逼真3D内容的开源项目。它结合图像提示和多视角扩散技术创建高质量3D模型,支持软阴影渲染,并提供简便的配置和安装指南。该项目展示了图像引导3D生成的最新应用,为计算机视觉和图形学研究提供了新的实验平台。