Project Icon

GaussianImage

使用2D高斯溅射实现快速图像表示和压缩

GaussianImage是一种基于2D高斯溅射的图像表示和压缩方法。它使用紧凑的2D高斯表示和新型栅格化技术,实现高效图像表示,具有训练时间短、GPU内存占用少和渲染速度快等特点。该方法结合矢量量化技术,构建了低复杂度的神经图像编解码器。解码速度达2000 FPS左右,优于JPEG等传统编解码器,并在低比特率下提供更好的压缩性能,推动了神经图像编解码技术的发展。

AIGS - AI生成图像作为数据源的前沿探索与应用
AI生成图像Github开源项目数据源深度学习综述计算机视觉
AIGS项目系统研究了AI生成图像(AIGC)作为数据源的最新发展。通过对方法和应用的分类,该项目全面概述了AIGC在视觉领域的进展,包括生成模型、神经渲染等技术,以及在2D/3D视觉感知、图像生成和自监督学习等方面的应用。此外,项目整理了相关数据集,为AIGC研究提供了丰富资源。
DiffIR - 创新扩散模型提升图像修复效率
DiffIRGithubICCV2023图像恢复开源项目扩散模型深度学习
DiffIR是一种专为图像修复设计的创新扩散模型。它结合了紧凑的图像修复先验提取网络、动态图像修复变换器和去噪网络,相比传统扩散模型实现了更快速、稳定的图像恢复。在多项图像修复任务中,DiffIR展现出最先进的性能,同时大幅降低计算成本,为图像修复技术开辟了新的发展方向。
rcg - RCG框架实现突破性无条件图像生成性能
GithubPyTorchRCG图像生成开源项目神经网络自监督学习
RCG是一种创新的自监督图像生成框架,在ImageNet 256x256数据集上达到了无条件图像生成的最佳性能。该框架缩小了无条件和有条件图像生成之间的性能差距。项目提供基于PyTorch的GPU实现,包含表示扩散模型(RDM)以及MAGE、DiT、ADM和LDM等多种像素生成器的训练和评估代码。同时提供预训练模型和可视化工具,便于研究人员复现和拓展相关工作。
latent-consistency-model - 高效快速的少步推理图像合成模型
AI绘图GithubLatent Consistency Models图像生成开源项目扩散模型深度学习
Latent Consistency Models (LCM) 是一种创新的图像生成技术,通过将分类器自由引导蒸馏到模型输入中,实现高效的少步推理。LCM支持文本到图像和图像到图像的生成,在极短时间内生成高质量图像,同时提供多种易用的演示。该技术在保持图像质量的同时显著缩短推理时间,为实时图像生成提供了新的可能性。
stable-diffusion-3.5-large-turbo-gguf - 直接量化的图像生成模型
AI社区GithubHuggingfaceStabilityAIstable-diffusion图像生成开源项目模型量化
stable-diffusion-3.5-large-turbo-gguf项目提供了对stabilityai的3.5稳定扩散模型的直接量化处理。模型文件可以在ComfyUI-GGUF自定义节点中运用,通过简单的文件部署即可实现。量化处理保持了原模型的许可证要求,提升了图像生成的运算效率,适用于文本到图像的生成任务。更多技术细节可以参考GitHub上的安装说明和量化类型概览。
Infusion - 基于扩散先验的3D高斯体场景修复技术
3D GaussiansGithub图像修复开源项目扩散模型深度补全神经渲染
InFusion项目提出了一种创新的3D场景修复方法,通过学习扩散先验的深度完成来修复3D高斯体。该技术实现了对不完整3D场景的高质量修复,能够处理复杂的遮挡情况。InFusion为3D重建和虚拟现实等领域提供了新的解决方案,项目开源了推理代码和预训练模型,为相关研究和开发提供了重要资源。
AISP - 深度学习应用于低级别计算机视觉与成像技术
AI Image Signal ProcessingComputational PhotographyGithubRAW图像处理图像增强多镜头散景效果开源项目
AISP项目聚焦于低级别计算机视觉和成像的深度学习应用,涵盖RAW图像处理、RAW重建与合成、学习型图像信号处理(ISP)、图像增强与恢复(如去噪和去模糊),以及多镜头散景效果渲染。项目亮点包括高效的散景效果渲染、适用于智能手机的实时感知图像增强、结合模型和数据驱动的ISP设计,以及AIM 2022 RAW重建挑战的解决方案。该项目定期更新,保持领域的前沿进展。
gill - 使用多模态语言模型的图像生成方法
CC3MGILLGithub图像生成多模态语言模型开源项目训练
GILL模型可处理交互的图像和文本输入以生成文本、检索图像及生成新图像。本文详细介绍了GILL模型的代码、预训练权重、环境设置、预训检查点和视觉嵌入的安装步骤。此外,还包括推理、训练及评估的指南,及启动Gradio演示的操作步骤。更多详情请参阅相关研究论文及项目页面。
blended-latent-diffusion - 快速高精度的局部文本引导图像编辑技术
Blended Latent DiffusionGithubSIGGRAPH 2023图像生成开源项目扩散模型文本驱动编辑
Blended Latent Diffusion是一种创新的局部文本引导图像编辑技术。该方法在低维潜在空间中操作,显著提高了编辑效率。通过融合扩散技术和优化策略,它解决了图像重建精度问题,并支持细微区域的局部编辑。与现有方法相比,Blended Latent Diffusion不仅处理速度更快,还实现了更高的编辑精度,同时减少了常见的图像伪影。该技术可应用于背景编辑、文本生成和对象修改等多个领域。
GauHuman - 基于单目人体视频的高效3D重建与渲染技术
GauHumanGithub人体建模单目视频实时渲染开源项目高斯泼溅
GauHuman是一种新型3D人体重建技术,利用单目人体视频学习关节化高斯散射模型。该方法训练速度快(1-2分钟),渲染实时(最高189 FPS),适用于ZJU-Mocap和MonoCap等数据集。GauHuman提供高效的训练和评估流程,在3D人体重建和渲染领域表现出色,为相关研究开辟新途径。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号