Project Icon

GNT

使用Transformer重建和渲染NeRF模型

Generalizable NeRF Transformer (GNT) 是一个用于高效重建和渲染神经辐射场的纯Transformer架构。它通过视图Transformer和射线路径Transformer两个阶段完成场景表示和渲染。GNT在跨场景训练中展示了其在多个数据集上优异的性能和普遍适用性。

GeoGaussian - 几何感知高斯分布的场景渲染新方法
3D GaussiansGithub几何约束场景渲染开源项目新视角合成点云
GeoGaussian是一种创新的场景渲染方法,利用几何感知的高斯分布优化来保持场景结构。它通过初始化表面对齐的薄高斯分布和约束优化,有效保持了场景的几何和纹理特征。该方法在新视角合成和几何重建方面表现优异,尤其适合结构化区域。项目开源了代码、数据集和使用说明,为计算机视觉研究提供了有价值的资源。
mint - 从零构建Transformer模型的详细教程和实现
BERTGithubHuggingFaceMinTPyTorchTransformer开源项目
该项目提供了一系列循序渐进的教程,指导从零开始构建常见的Transformer模型,如BERT、GPT、GPT2、BART和T5。教程不仅讲解基本架构的实现,还包括预训练和微调示例,并提供小型PyTorch库以便额外使用。项目依赖HuggingFace的tokenizers库进行子词标记,适用于不同规模数据集的训练需求,还涵盖了多工作节点的分布式训练示例,非常适合希望深入了解Transformer模型原理和应用的学习者。
TransBTS - 使用Transformer实现多模态脑肿瘤医学图像分割
GithubTransBTSTransBTSV2Transformer多模态数据集开源项目脑肿瘤分割
TransBTS与TransBTSV2采用Transformer技术显著提升多模态脑肿瘤与医学图像体积分割的效率与准确性。项目包括详细的模型实现和相关文献,支持BraTS、LiTS、KiTS等医学图像数据集,并利用Python和Pytorch进行数据预处理、模型训练和测试,支持分布式训练。适用于需要高效精准医学图像分割解决方案的研究人员和工程师。
gpt-fast - PyTorch原生高效文本生成项目
GithubPyTorchgpt-fast开源项目性能优化文本生成模型量化
gpt-fast是一个基于PyTorch的高效Transformer文本生成项目,代码精简(<1000行Python),仅依赖PyTorch和sentencepiece。项目特点包括极低延迟、int8/int4量化、推测解码和张量并行,支持NVIDIA和AMD GPU。gpt-fast不是框架或库,而是展示原生PyTorch性能的示例。它支持LLaMA系列和Mixtral 8x7B等模型,提供详细基准测试和多种优化技术。该项目实现了高效的文本生成,展现了PyTorch在AI领域的强大性能。
CustomNet - 创新的物体定制与多视角生成扩散模型
CustomNetGithub对象定制开源项目文本生成图像深度学习视角控制
CustomNet是一个创新的文本到图像扩散模型框架,专注于物体定制和多视角生成。该模型整合了3D新视角合成能力,实现物体空间位置和视角的灵活调整,同时保持物体身份。CustomNet无需测试时优化,可同时控制视角、位置和文本,在身份保持、多样性和协调性方面表现出色。这一技术为物体定制和图像生成领域开辟了新的可能性。
gliner_multi - 灵活识别多语言实体的开源NER模型
GLiNERGithubHuggingface命名实体识别多语言模型开源项目机器学习模型自然语言处理
GLiNER-multi是一个基于双向Transformer架构的开源多语言命名实体识别模型。它能够灵活识别各种实体类型,填补了传统NER模型与大型语言模型之间的空白。该模型在Pile-NER数据集上训练,支持多语言处理,易于集成到不同的自然语言处理应用中。GLiNER-multi在保证性能的同时优化了模型规模,适用于计算资源有限的场景。
TransformerEngine - 用于在 NVIDIA GPU 上加速 Transformer 模型的库
FP8GithubHopper GPUNVIDIATransformer Engine开源项目深度学习
Transformer Engine是NVIDIA推出的一个库,专门用于在其GPU上加速Transformer模型。该库支持8位浮点(FP8)精度,使训练和推理性能大幅提升的同时,内存使用降低。TE提供了一系列优化的构建模块和混合精度API,适用于各种流行的深度学习框架,保证精度不受影响。通过与主流大型语言模型库的集成,简化了FP8支持的实现,使Transformer模型的训练和推理更加高效和便捷,适用于多种NVIDIA GPU架构。
HyperInverter - 超网络技术实现高质量StyleGAN图像反演
GAN反演GithubStyleGAN人脸生成图像编辑开源项目超网络
HyperInverter是一种两阶段StyleGAN反演方法,结合编码器和超网络实现高质量图像重建、良好可编辑性和快速推理。实验表明,该方法在保持编码器级推理速度的同时,重建质量显著优于现有编码器方法,接近优化方法。在人脸和建筑图像上均取得出色效果。
Radiance-Fields-from-VGGSfM-Mast3r - VGGSfM和Mast3r在3D重建和辐射场生成中的性能对比
3D重建GithubMast3rRadiance FieldsVGGSfM开源项目相机姿态估计
本项目对比了VGGSfM和Mast3r两种深度学习方法在3D重建和辐射场生成中的性能。研究表明,VGGSfM在相机姿态重建方面更为精确,适合逆渲染;Mast3r则提供更密集的点云重建。项目还开发了Mast3r结果转COLMAP格式的工具和在线结果查看器,为相关研究提供了便利。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号