Project Icon

LaRa

大基线辐射场技术实现突破性进展

LaRa项目开发了创新的大基线辐射场技术,提高了3D重建效率和质量。通过支持半精度训练,该技术实现了收敛速度提升100%以上,性能增益约1.5dB。LaRa能从多视图、文本和单视图输入重建辐射场,在计算效率和重建质量方面取得了显著进展,为3D重建和渲染领域开辟了新途径。

CF-3DGS - 免COLMAP的3D高斯散射场景重建技术
3D Gaussian SplattingGithub三维重建开源项目无监督学习神经渲染计算机视觉
CF-3DGS是一种新型3D场景重建技术,无需依赖COLMAP等传统SfM工具。该方法可直接从未标定图像序列学习3D高斯散射表示,通过迭代优化相机姿态和场景表示来实现高质量新视角合成。在Tanks and Temples等数据集上,CF-3DGS展现出优秀性能,为3D重建和新视角合成领域提供了高效灵活的解决方案。
LoRA - 大型语言模型的低秩适配方法与参数节省
DeBERTaGLUEGPT-2GithubLoRARoBERTa开源项目
LoRA通过低秩分解矩阵实现大型语言模型的低秩适配,减少了训练参数数量,实现高效的任务切换和存储节省。它在GLUE基准测试中的表现与完全微调相当或更好,同时显著降低了参数需求。LoRA支持RoBERTa、DeBERTa和GPT-2等模型,并已集成到Hugging Face的PEFT库中,提供了便捷的适配解决方案。
awesome-NeRF - 全面汇总神经辐射场研究进展和应用
3D重建GithubNeRF开源项目神经辐射场视图合成计算机视觉
该项目汇集了神经辐射场(NeRF)领域的前沿论文、讲座和实现资源。内容涵盖加速推理和训练、压缩技术、非受限图像处理、可变形NeRF以及视频应用等多个研究方向。通过这份全面的资源列表,研究人员和开发者可以快速了解NeRF技术的最新进展和关键文献,为相关研究和应用提供参考。
LGM - 多视图高斯模型实现高质量3D内容创建
3D内容创建GithubLGM多视图开源项目高分辨率高斯模型
LGM是一种大规模多视图高斯模型,用于创建高分辨率3D内容。该模型可将文本或图像转换为高质量3D模型,并支持快速推理和训练。项目开源了完整代码、预训练权重和演示应用,为3D内容创作提供了实用工具。LGM在3D重建的精度和效率上有显著提升,推动了计算机图形学和视觉领域的发展。
SD3.5-LoRA-Linear-Red-Light - 利用Linear Red Light技术创造图像生成解决方案
GithubHalloweenHuggingfaceLoRAStable Diffusion图像生成开源项目模型线性红光
SD3.5-LoRA-Linear-Red-Light项目通过利用Stable Diffusion 3.5和线性红光关键词生成高质量图像,在不同场景如万圣节装扮、猫咪与埃菲尔铁塔中展示多样化效果。这项技术强调其推理能力和过滤低分辨率图像的效果,经过Shakker-Labs的调优,支持在CUDA设备上运行,为图像生成提供高效解决方案。
S-LoRA - 大规模并发LoRA适配器高效服务系统
GPU内存优化GithubLoRA适配器S-LoRA大语言模型开源项目批处理推理
S-LoRA系统针对大规模LoRA适配器服务进行优化。采用统一分页、异构批处理和新型张量并行策略,提高内存管理效率和GPU利用率。相较现有技术,S-LoRA提升吞吐量4倍,显著增加可服务适配器数量。这一突破为大规模定制语言模型部署开辟新途径。
cameduru-xlab-flux-anime-lora - FLUX模型训练的自然光影场景LoRA
AI绘图FLUX.1-devGithubHuggingfaceLoRAStable Diffusion图像生成开源项目模型
该LoRA模型通过FLUX.1-dev训练,主要用于生成具有自然光影和柔和色调的图像。模型可处理人像、街拍、风景和静物等日常场景,实现kodachrome胶片质感和光线泄漏效果。其特点是还原真实的光影层次和自然色彩,适用于需要呈现真实光影氛围的图像创作。
DeSRA - GAN超分辨率模型伪影智能检测与消除
DeSRAGANGithub人工智能图像处理开源项目超分辨率
DeSRA项目开发了创新方法,用于检测和消除GAN实际场景超分辨率模型中的伪影。该方法能高效识别伪影区域,通过微调策略消除同类伪影,只需少量样本即可。这一技术突破缩小了超分辨率算法在实际应用中的差距,为图像质量提升开辟了新途径。
NeuralLift-360 - 将2D照片转换为360度全方位3D模型的创新技术
3D建模GithubNeuralLift-360图像处理开源项目深度学习计算机视觉
NeuralLift-360是一项将单张2D照片转换为360度全方位3D模型的技术。该项目结合深度学习和计算机视觉,分析图像深度信息和前景掩码,实现高质量3D重建。项目提供Gradio应用界面,支持文本反转和Imagic微调功能,为研究人员和开发者提供实用的3D生成工具。
Neural-Gauge-Fields - 创新3D场景表示实现灵活UV映射与高效渲染
3D重建GithubUV映射三平面投影开源项目神经规范场视图合成
Neural-Gauge-Fields项目提出创新3D场景表示方法,通过学习UV映射和三平面投影实现灵活纹理编辑和高效渲染。项目引入InfoInv技术,提升基于网格和MLP的神经场性能。这一方法为3D视图合成、场景编辑和表面重建提供新工具,在计算机图形学和视觉领域展示应用前景。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号