Project Icon

CoDA_NeurIPS2023

创新3D目标检测框架实现开放词汇表任务

CoDA是一个开源的开放词汇表3D目标检测框架,通过协作式新颖框发现和跨模态对齐技术提高对未见类别的检测能力。该项目支持ScanNet和SUN RGB-D数据集,提供完整的代码、预训练模型和数据集。CoDA的创新方法在NeurIPS 2023发表,为3D场景理解研究提供了新的思路。项目基于PyTorch开发,并提供详细的安装和使用指南。

SegmentAnythingin3D - NeRF模型的三维目标分割框架SA3D
3D分割GithubNeRFSA3DSAM开源项目计算机视觉
SA3D是一个创新的三维目标分割框架,基于神经辐射场(NeRF)模型。它允许用户通过单一视图的手动提示,快速获取目标对象的3D分割结果。SA3D支持点提示和文本提示输入,处理时间约为2分钟。该框架在建筑、室内场景和复杂物体等多种应用场景中展现了良好的适应性,为3D场景感知和虚拟现实内容创作提供了新的可能。项目还包含直观的图形界面,便于研究人员和开发者进行快速实验和应用开发。
Open3D-ML - Open3D 的扩展,用于处理 3D 机器学习任务
3D机器学习GithubOpen3D-MLPyTorchTensorFlow开源项目语义分割
Open3D-ML基于Open3D库,扩展了3D机器学习工具,支持语义点云分割和目标检测等应用。提供预训练模型和训练管道,兼容TensorFlow和PyTorch框架,易于集成到现有项目中。同时,提供数据可视化等通用功能,覆盖多种数据集和算法,提高3D数据处理效率和效果。
awesome-camouflaged-object-detection - 伪装物体检测研究进展综述与资源汇总
Github伪装物体检测图像分割开源项目数据集深度学习计算机视觉
本项目全面总结伪装物体检测(COD)领域的研究进展,涵盖检测、分割、场景理解等方向。汇集顶级论文、数据集和代码资源,定期更新最新成果。为研究人员提供了解COD前沿进展的重要参考。
vision3d - PyTorch驱动的开源激光雷达感知库
3D检测GithubLIDAR感知PV-RCNNPyTorchSECOND模型开源项目
Vision 3D是一个基于PyTorch的开源库,专注于激光雷达感知领域。该项目以代码简洁性为核心,便于扩展新模型和数据集。目前已实现SECOND算法,并部分完成PV-RCNN。虽然开发已暂停,但项目仍提供详细文档和示例,支持研究人员和开发者在3D目标检测领域的应用。Vision 3D作为开源工具,欢迎社区贡献,为激光雷达感知研究提供了有价值的资源。
Uni3D - 突破性统一3D表示学习框架
3D表示GithubUni3D开源项目点云零样本分类预训练
Uni3D是一个创新的3D预训练框架,致力于大规模3D表示学习。该框架采用2D预训练模型初始化,通过端到端训练实现3D点云与图像-文本特征对齐。Uni3D凭借简洁架构和高效预训练,成功将模型规模扩展至10亿参数,在多项3D任务中取得突破性进展,展现了将2D深度学习优势迁移至3D领域的巨大潜力。
Real3D - 基于真实图像的大规模3D重建模型
3D重建GithubReal3D开源项目深度学习自监督学习计算机视觉
Real3D是一种创新的大规模3D重建模型系统,首次实现了使用单视图真实图像进行训练。该系统采用自训练框架,结合3D/多视图合成数据和单视图真实图像,并引入两种无监督损失函数,实现像素和语义层面的模型监督。在包含真实和合成数据、域内和域外形状的四种评估场景中,Real3D均显著优于现有方法。
open-cd - 开源变更检测工具箱,支持多种视觉任务模型
GithubOpen-CDPyTorch变化检测工具箱开源开源项目技术报告
Open-CD是一个基于开源通用视觉工具的变更检测工具箱,支持多种变更检测模型和数据集。项目提供详细文档和示例,支持PyTorch 2.0等工具,并在GitHub和Hugging Face上发布。最新技术报告已在arXiv上线,用户可从Colab教程快速上手,并有详细的安装、训练和测试指南。
Open3D - 支持快速开发的3D数据处理开源库
3D数据处理C++ APIGPU加速GithubOpen3DPython API开源项目
支持快速开发3D数据处理应用的开源库,提供C++和Python接口。核心功能包括3D数据结构、3D数据处理算法、场景重建、表面对齐、3D可视化、基于物理的渲染(PBR)、3D机器学习支持(与PyTorch和TensorFlow兼容)、核心3D操作的GPU加速。适用于Ubuntu、macOS和Windows平台,支持源码编译和pip安装。
i-Code - 打造集成可组合的多模态人工智能框架
GithubProject i-Code基础模型多模态人工智能开源项目文档智能视觉问答
i-Code是一个致力于多模态人工智能研究的开源项目。它提供了多个版本的多模态基础模型,包括i-Code V1、V2和V3(CoDi),以及i-Code Studio框架。项目还涉及多模态文档智能和基于知识的视觉问答技术。i-Code为AI领域提供了集成视觉、语言和语音的多模态工具,促进了人工智能的跨领域发展。
grounding-dino-tiny - Grounding DINO模型实现开放集目标检测的创新突破
GithubGrounding DINOHuggingface开源项目模型深度学习目标检测计算机视觉零样本学习
Grounding DINO模型通过结合DINO与接地预训练技术,实现了开放集目标检测。该模型添加文本编码器,扩展了传统闭集检测模型的能力,可进行零样本目标检测。在COCO数据集上,Grounding DINO取得了52.5 AP的优秀成绩,为计算机视觉中未标记物体的识别提供了新的解决方案。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号