#计算机视觉
opencv-python - OpenCV的Python接口
OpenCVPython计算机视觉图像处理机器学习Github开源项目
opencv-python是OpenCV的预编译Python包,提供广泛的计算机视觉功能。支持主流桌面和服务器环境,包含完整和headless版本。易于安装使用,适合各级开发者的计算机视觉应用。定期随OpenCV更新,保证用户可使用最新算法和功能。
awesome-6d-object - 6D物体姿态估计与重建资源汇总
物体姿态估计3D重建计算机视觉深度学习CVPRGithub开源项目
这个项目整理了6D物体姿态估计、单视图3D物体重建和3D手-物体姿态估计领域的重要资源。内容包括arXiv论文、期刊会议论文、学位论文、数据集、研讨会和挑战赛信息。资源按年份和会议分类,涵盖2014年至今的研究进展,为相关研究人员提供了全面的参考。
Awesome-Mamba-in-Low-Level-Vision - Mamba模型在低级视觉任务中的应用资源汇总
Mamba计算机视觉图像处理深度学习状态空间模型Github开源项目
该项目汇总了Mamba状态空间模型在低级视觉任务中的应用资源。涵盖图像恢复、超分辨率、去雨、去雾等多个领域的最新研究。提供论文链接和代码仓库,便于研究者了解和实践这一前沿技术。资源涉及图像处理、视频修复、遥感图像等多个方向,为探索Mamba模型在计算机视觉领域潜力的研究人员提供参考。
opencv_extra - OpenCV额外数据与资源库
OpenCV计算机视觉开源库图像处理GitHubGithub开源项目
opencv_extra仓库为OpenCV库提供额外数据支持。包含官方网站、文档、问答论坛等重要资源链接,以及问题追踪系统。仓库还提供了详细的贡献指南,涵盖pull request规范、分支选择、测试文档要求、提交历史管理和编码风格等关键开发规则。
LLIE_Survey - 低光照图像和视频增强技术最新进展综述
低光照图像增强深度学习计算机视觉图像处理视频增强Github开源项目
该研究全面综述了低光照图像和视频增强(LLIE)技术,提出SICE_Grad和SICE_Mix数据集用于复杂混合曝光场景,引入Night Wenzhou视频数据集包含航拍和街景。研究梳理LLIE发展历程,系统分类各种方法,提供基准数据集和评估指标,为研究者提供重要参考。
keras-cv - 跨框架模块化计算机视觉工具集
KerasCV计算机视觉深度学习Keras模型训练Github开源项目
keras-cv 是基于 Keras 3 的模块化计算机视觉库,兼容 TensorFlow、JAX 和 PyTorch。它为数据增强、分类、目标检测等视觉任务提供高级组件,支持跨框架迁移,并包含预训练模型。该库旨在帮助开发者高效构建生产级计算机视觉应用。
MonocularTotalCapture - 单目3D人体姿态全方位捕捉系统
人体姿态估计计算机视觉3D建模深度学习Adam模型Github开源项目
MonocularTotalCapture是一个开源项目,旨在实现野外环境下的单目3D人体姿态全方位捕捉。该系统同时捕捉人脸、身体和手部姿态,采用Adam可变形人体模型和OpenPose技术。基于CVPR19研究成果,项目提供完整的安装使用指南,为计算机视觉研究和3D重建提供了有力工具,仅限非商业研究使用。
d2l-pytorch-slides - 基于PyTorch的深度学习教程幻灯片集 涵盖基础到高级主题
PyTorch深度学习笔记本幻灯片神经网络计算机视觉Github开源项目
此项目包含一系列深度学习教程幻灯片,基于PyTorch框架。内容涵盖线性代数、卷积神经网络、循环神经网络和注意力机制等主题,从基础到高级逐步深入。幻灯片采用Jupyter Notebook格式,便于交互式学习和实践。资源适合系统学习深度学习知识的学习者和研究人员。
assets - 视觉资产和AI模型资源库
Ultralytics计算机视觉预训练模型数据集YOLOGithub开源项目
Ultralytics Assets 仓库集成了视觉资产、预训练模型和数据集,为 Ultralytics YOLO 生态系统提供支持。该仓库涵盖对象检测、实例分割、图像分类等计算机视觉任务,为研究人员和开发者提供便捷的资源访问,加速机器学习项目的开发和优化。此仓库提供了完整的资源套件,包括视觉素材、预训练模型和注释数据集,适用于多种计算机视觉任务。它简化了资源获取过程,使开发者能够专注于项目开发而非资源收集,从而提高工作效率。
InstantMesh - 高效单图3D网格生成技术,利用稀疏视图大型重建模型
3D网格生成单图重建InstantMesh深度学习计算机视觉Github开源项目
InstantMesh是一个基于LRM/Instant3D架构的前馈框架,能从单张图像高效生成3D网格。它采用稀疏视图大型重建模型,提供多种模型变体,支持白色背景图像生成。项目开源了推理和训练代码、模型权重,并提供Gradio在线演示。InstantMesh在3D内容创作和计算机视觉等领域有广泛应用潜力。
vision - TorchVision 计算机视觉库 提供数据集模型和图像处理功能
torchvision计算机视觉PyTorch图像处理深度学习Github开源项目
TorchVision是PyTorch生态系统的计算机视觉库,提供常用数据集、模型架构和图像变换功能。它支持torch张量和PIL图像后端,具备视频处理能力。该库同时提供Python和C++ API,适用于各种计算机视觉任务。TorchVision版本与PyTorch和Python版本兼容,持续更新以支持最新技术。
awesome-lane-detection - 车道线检测研究综述,论文、代码与数据集汇总
车道检测深度学习计算机视觉自动驾驶论文综述Github开源项目
本项目整理了车道线检测领域的研究论文、代码实现、数据集和教程资源。内容包括2017年至今的深度学习方法、3D检测、弱监督等主流技术。收录了公开数据集和开源代码,为研究提供参考。项目持续更新最新进展,是该领域的重要资源汇总。
awesome-demos - Gradio构建的AI演示和应用集合
Gradio演示自然语言处理计算机视觉机器学习Github开源项目
该项目汇集了使用Gradio构建的多样化AI演示和应用。涵盖自然语言处理、计算机视觉等领域,包括文本生成、图像处理、语音合成等功能。展示了AI技术的多样性和实用性,为开发者提供参考和灵感。
pytorch-image-models - 全面的PyTorch图像模型集合
PyTorch图像模型深度学习神经网络计算机视觉Github开源项目
pytorch-image-models是一个综合性PyTorch图像模型库,提供最新计算机视觉模型、预训练权重和训练脚本。库中包含CNN和Transformer等多种架构,支持迁移学习和特征提取。项目不断更新,近期新增MobileNetV4模型并优化现有模型性能。该库为计算机视觉研究和开发提供了丰富的工具和资源。
Awesome-Reasoning-Foundation-Models - 基础模型推理能力资源汇总
基础模型人工智能机器学习自然语言处理计算机视觉Github开源项目
本资源列表汇总了基础模型推理能力相关内容,包括语言、视觉和多模态基础模型,以及常识、数学、逻辑等多领域推理任务应用。同时概述了预训练、微调、对齐训练等推理技术,为研究人员和开发者提供全面参考。
Awesome-Open-Vocabulary-Semantic-Segmentation - 开放词汇语义分割研究成果汇总
开放词汇语义分割计算机视觉深度学习CLIPGithub开源项目
这是一个汇总开放词汇语义分割领域研究成果的项目。内容涵盖全监督、弱监督和无需训练等多种方法,同时收录零样本语义分割、指代图像分割和开放词汇目标检测等相关任务的论文。项目旨在为研究者提供该领域的最新进展概览。
CV-Company-List - 全面汇总国内计算机视觉算法岗位公司名录
互联网公司Github开源项目CV算法岗AI求职计算机视觉算法工作
CV-Company-List项目整理了国内计算机视觉(CV)算法岗位公司名录,覆盖北京、上海、深圳、杭州等主要城市。名录包含外企、互联网公司和AI独角兽企业,涵盖知名公司和新兴AI企业。项目为CV算法工程师求职提供参考,并设有AI算法岗求职交流群。该资源旨在帮助求职者全面了解国内CV算法岗位分布情况。该项目持续更新,旨在为计算机视觉领域的求职者提供全面、实时的行业信息。
YOLOv6 - 高性能目标检测框架支持多场景应用
YOLOv6目标检测深度学习计算机视觉模型训练Github开源项目
YOLOv6是一款高效的目标检测框架,提供从轻量级到大型的多种模型选择。它在速度和精度上取得平衡,支持量化和移动端部署,适用于各种实时检测场景。最新版本还引入了分割功能,扩展了应用范围。YOLOv6不仅适用于工业领域,还可广泛应用于安防、交通等多个领域。
MDT - MDTv2图像合成模型:更快收敛和卓越性能
Masked Diffusion Transformer图像合成深度学习人工智能计算机视觉Github开源项目
MDTv2是一种先进的深度学习图像合成模型,在ImageNet数据集上实现了1.58的FID分数,创造新的业界标准。该模型采用掩码潜在建模技术,提高了图像语义理解能力,学习速度比先前模型快10倍以上。MDTv2在图像生成质量和训练效率方面都有显著提升,为计算机视觉和人工智能领域带来了新的可能性。
fvcore - FAIR开发的轻量级计算机视觉库 提供核心共享功能
fvcore计算机视觉PyTorch深度学习FAIRGithub开源项目
fvcore是FAIR开发的轻量级计算机视觉库,为多个框架提供核心共享功能。它包含常用PyTorch组件、FLOP计数工具、参数计数、BatchNorm统计重计算和超参数调度器等特性。该库支持Detectron2、PySlowFast和ClassyVision等项目,所有组件经过严格测试,兼容Python 3.6+和PyTorch环境。
diffae - 基于扩散模型的自编码器框架实现图像生成与编辑
Diffusion Autoencoders生成模型图像处理深度学习计算机视觉Github开源项目
diffae项目实现了基于扩散模型的自编码器框架,用于高质量图像的生成和编辑。该项目提供多个预训练模型,支持FFHQ、LSUN等数据集,实现了无条件生成、图像操作和插值等功能。项目包含使用说明、模型检查点和针对不同数据集的训练脚本,为图像生成和编辑研究提供了完整的工具链。
BrushNet - 双分支扩散结构实现即插即用图像修复模型
BrushNet图像修复扩散模型深度学习计算机视觉Github开源项目
BrushNet是一种新型图像修复模型,采用双分支扩散结构,可集成到预训练扩散模型中。通过分离遮罩图像特征和噪声潜在表示,并对预训练模型实施像素级控制,提高了图像修复效果。该模型适用于通用场景和特定应用,为图像编辑和生成提供了新的解决方案。
Mamba-in-CV - Mamba模型在计算机视觉领域的最新应用概览
Mamba计算机视觉深度学习图像处理神经网络Github开源项目
本项目整理了近期Mamba模型在计算机视觉领域的研究论文,涵盖分类、检测、分割、增强等多项CV任务。内容展示了Mamba在视觉应用中的潜力,并持续更新,为研究者提供了解该领域最新进展的便捷渠道。
awesome-multi-task-learning - 精选多任务学习资源集合 涵盖数据集代码库和研究论文
多任务学习机器学习神经网络计算机视觉自然语言处理Github开源项目
此项目汇集了多任务学习(MTL)领域的精选资源,包含数据集、代码库和研究论文。涉及计算机视觉、自然语言处理、强化学习等多个领域的MTL基准测试和数据集。另外还收录了MTL架构、优化方法和任务关系学习等相关研究。对于研究人员和工程师深入学习和应用MTL技术而言,这是一个极具参考价值的资源库。
carla_garage - 突破端到端自动驾驶模型的隐藏偏差 高性能仿真平台
CARLA自动驾驶端到端模型计算机视觉深度学习Github开源项目
基于CARLA仿真器的端到端自动驾驶研究开源项目。提供可配置代码、文档和高性能预训练模型,揭示了端到端驾驶模型的隐藏偏差。在多个基准测试中表现优异,支持数据生成、模型训练和评估,有助于研究人员探索自动驾驶前沿问题。
arxiv-daily - 定制化arXiv论文追踪系统 轻松掌握学术前沿动态
arXiv计算机视觉深度学习3D重建神经辐射场Github开源项目
arxiv-daily是一个自动化arXiv论文摘要更新系统。该项目每日整理3D视觉、点云匹配、目标跟踪等领域的最新论文。用户可定制关键词筛选感兴趣的论文,实现高效的学术前沿追踪。系统支持历史数据查询功能,为研究人员提供便捷的文献管理平台。通过arxiv-daily,科研工作者可以轻松掌握学术动态,提升科研效率。
ai2thor - AI智能体交互研究的高仿真仿真环境
AI2-THOR人工智能交互式环境计算机视觉机器人学习Github开源项目
AI2-THOR是一个高仿真的交互式AI研究框架。它包含200多个精细场景、2600多个家居物品和200多种交互动作,支持多类智能体和图像模态。框架具备逼真的物理交互,适用于导航和操作任务研究。同时提供丰富元数据和自定义奖励功能。AI2-THOR为体现式AI研究提供了功能全面的仿真环境。
gta - 几何感知注意力机制增强多视图Transformer性能
GTA多视图Transformer几何感知注意力神经渲染计算机视觉Github开源项目
GTA是一种创新的几何感知注意力机制,旨在提升多视图Transformer的表达能力。这项技术不仅适用于新视角合成和3D场景重建等多视图任务,还可应用于图像生成等2D任务。项目提供了GTA在CLEVR-TR和MSN-Hard数据集上的官方实现代码,并展示了其在ImageNet图像生成中的应用。通过整合几何信息,GTA使Transformer更有效地处理3D空间关系,从而显著提高多视图任务的性能表现。
SAM4MIS - 医学图像分割技术的前沿进展
SAM医学图像分割深度学习计算机视觉人工智能Github开源项目
SAM4MIS项目综述了Segment Anything Model (SAM)和SAM2在医学图像分割领域的应用进展。该项目涵盖了从经验评估到方法改进的全面研究成果,为医学图像分割提供了最新见解。通过持续跟踪和汇总SAM相关研究,SAM4MIS为医学图像分析研究提供了重要参考,促进了该领域技术的创新。
GaussianFlow - 高斯动态结合点云渲染的4D内容创作方法
GaussianFlow3D重建计算机视觉深度学习光流Github开源项目
GaussianFlow项目提出了一种4D内容创作方法,结合高斯动态与点云渲染技术。该项目利用优化的CUDA实现高效计算高斯流,并采用特定的梯度计算策略提高训练速度。这一方法为动态场景建模和渲染提供了新的解决方案,可应用于虚拟现实、增强现实和计算机图形学等领域。
3D-Gaussian-Splatting-Papers - 3D高斯溅射技术论文集锦:最新研究进展与应用
3D Gaussian Splatting计算机视觉三维重建新视角合成深度学习Github开源项目
本项目汇集了3D高斯溅射(3D Gaussian Splatting)领域的前沿研究论文,涵盖基础理论与实际应用。收录内容包括多篇综述文章和顶级会议论文,按时间倒序排列。提供论文中英文摘要和代码链接,为3D场景重建和新视角合成研究提供全面参考。
WonderJourney - 将单一图像转化为连贯的旅程视频的开源AI项目
WonderJourneyAI生成视频景观转换计算机视觉深度学习Github开源项目
WonderJourney是一个开源AI项目,将单一图像转化为连贯的旅程视频。该项目结合深度学习技术,包括场景理解、图像生成和3D渲染,实现从任意起点到多样目的地的虚拟探索。WonderJourney为虚拟旅行、教育和娱乐领域提供了新的应用可能。
HAC - 基于哈希网格的3D高斯点云压缩技术
3D Gaussian Splatting压缩算法HAC哈希网格计算机视觉Github开源项目
HAC是一种新型3D高斯点云压缩技术,采用二进制哈希网格建立空间一致性,通过上下文模型分析锚点关系。该方法结合高斯分布熵编码和自适应量化,提升压缩效果。HAC还引入自适应掩蔽策略优化模型结构。作为首个基于上下文的3DGS压缩方案,HAC显著减小了模型体积,为3D场景表示压缩领域带来新突破。
flowmap - 基于梯度下降的相机姿态、内参和深度优化技术
FlowMap计算机视觉相机姿态估计深度学习光流Github开源项目
FlowMap是一种创新的相机姿态、内参和深度估计技术,通过梯度下降优化获得高质量结果。该开源项目提供完整代码实现、预训练模型和评估数据集,支持多种数据集并提供丰富的实验配置。FlowMap在多个基准测试中表现出色,为计算机视觉和3D重建研究提供了有力支持。
objectsdf_plus - 物体组合式神经隐式表面重建技术的进阶版本
ObjectSDF++神经隐式表面3D重建计算机视觉深度学习Github开源项目
ObjectSDF++是物体组合式神经隐式表面重建技术的改进版本。该技术通过引入遮挡感知的不透明度渲染公式和物体区分正则化项,提高了实例掩码监督的利用效率,从而在场景和物体层面实现更精确的表面重建。项目提供了适用于Replica和ScanNet数据集的训练和评估代码,为3D场景理解和重建研究提供了新的工具。
fastai - 一个为从业者提供快速提供在标准深度学习领域中提供最先进的高级组件,并提供可以混合和匹配的低级组件构建新方法的深度学习库
fastaiPyTorch深度学习计算机视觉GPU优化Github开源项目
fastai是一个深度学习库,提供高层组件以快速实现高性能结果,同时为研究人员提供可组合的低层组件。通过分层架构和Python、PyTorch的灵活性,fastai在不牺牲易用性、灵活性和性能的情况下,实现了高效的深度学习。支持多种安装方式,包括Google Colab和conda,适用于Windows和Linux。学习资源丰富,包括书籍、免费课程和详细文档。
相关文章
人工智能顶级会议录用率分析:从数据看AI研究的发展趋势
2024年08月30日
SmartOpenCV: 增强Android端OpenCV图像预览功能的开源库
2024年08月30日
SmartOpenCV: Android端OpenCV增强库的革新之作
2024年08月30日
OpenCV:开源计算机视觉库的领军者
2024年08月30日
Supervision: 强大的计算机视觉工具库
2024年08月30日
CVAT:开源计算机视觉标注工具的领军者
2024年08月30日
FiftyOne: 构建高质量数据集和计算机视觉模型的开源工具
2024年08月30日
GluonCV: 先进的计算机视觉深度学习工具包
2024年08月30日
PyTorch-Grad-CAM:计算机视觉的高级AI可解释性工具
2024年08月29日