#计算机视觉
opencv - OpenCV开源计算机视觉库资源与贡献指导
OpenCV计算机视觉开源库AI文档Github开源项目
OpenCV是开源的计算机视觉库,提供详尽的文档、在线课程和活跃的Q&A论坛。用户可在GitHub上报告问题和贡献代码,需遵循明确的贡献指南。此外,OpenCV支持提交社区项目和参与志愿者活动,通过多个平台获取最新的计算机视觉与AI动态。
supervision - 可重复的计算机视觉工具
Supervision计算机视觉模型连接器数据集工具图像标注Github开源项目
Supervision 是一个模型无关的计算机视觉工具包,支持分类、检测和分割模型的集成。用户可以加载数据集、可视化检测结果并进行区域统计。该工具包提供了丰富的注释和数据集处理功能,适用于零售和交通管理等领域。了解更多关于使用 Supervision 加速计算机视觉应用开发的信息。
cvat - 交互式视频和图像标注工具,支持数据驱动的AI开发
CVAT数据标注工具计算机视觉AI自动标注DockerGithub开源项目
CVAT是一个计算机视觉的交互式视频和图像标注工具,被全球数万用户和企业广泛使用。提供免费在线版和自托管解决方案,支持Roboflow和HuggingFace集成。支持多种标注格式,并通过自动标注功能加速标注过程。企业用户可享受高级功能和专业支持服务。
skyvern - 自动化浏览器工作流,集成大语言模型与计算机视觉
Skyvern自动化浏览器工作流LLM计算机视觉Github开源项目
Skyvern结合大语言模型(LLMs)和计算机视觉,提供简单的API端点,实现大量网站的工作流自动化,解决传统方法的不稳定性。无需定制代码即可操作新网站,对布局变化具有抗性,并能在多个网站上应用相同工作流。Skyvern云版本让用户无需管理基础设施即可运行多个实例,并提供反机器人检测、代理网络和验证码解决方案。
daily-paper-computer-vision - 计算机视觉与深度学习论文每日精选更新
CVer计算机视觉计算机视觉深度学习机器学习AI论文Github开源项目
该项目每日更新和整理计算机视觉、深度学习及机器学习领域的最新优质论文和项目,涵盖多个研究方向。内容涵盖从2017年至今的顶会顶刊论文列表和代码链接,为研究人员提供丰富的资源参考。
fiftyone - 高效的数据集构建与计算机视觉模型工具
FiftyOne数据集计算机视觉模型评估机器学习Github开源项目
FiftyOne 是一款提升机器学习工作流的开源工具,通过可视化数据集和解读模型结果来提高效率。用户可用它处理复杂标签、评估模型、探索场景、识别错误模式和注释错误等。安装简便,可通过 pip 安装并运行示例代码快速上手。
gluon-cv - 计算机视觉领域的深度学习模型工具包,支持PyTorch和MXNet框架
GluonCV计算机视觉深度学习图像分类对象检测Github开源项目
GluonCV是一个面向工程师、研究人员和学生的计算机视觉深度学习工具包,支持快速原型设计。其主要功能包括可复现SOTA结果的训练脚本、对PyTorch和MXNet框架的支持、大量预训练模型,以及简化实现的API设计和社区支持。用户还可以通过AutoGluon执行图像分类和目标检测任务。
monodepth2 - 基于自监督学习的单目深度估计实现
Monodepth2深度估计PyTorch自监督学习计算机视觉Github开源项目
本项目提供了PyTorch实现的代码,用于训练和测试深度估计模型。代码采用自监督学习方法,支持单目和立体图像的深度预测。提供多种预训练模型和自定义数据集,兼容不同的图像分辨率。适用于研究和非商业用途,包含详细的设置指南、训练和评估说明。用户可通过此项目高效开发和优化深度估计模型。
SmartOpenCV - Android平台的增强型计算机视觉库
SmartOpenCVOpenCV端侧智能计算机视觉图像处理Github开源项目
SmartOpenCV是一个用于Android平台的增强型OpenCV库,解决了官方SDK在图像预览中的问题。无需修改SDK源码,只需替换xml标签,即可自动适应摄像头参数、横竖屏切换及预览帧大小。该库支持USB摄像头,提供友好的API接口,方便开发者灵活控制预览显示。SmartOpenCV与官方SDK解耦,确保项目能够轻松升级至最新版本。
pytorch-grad-cam - 全面解析AI在计算机视觉领域的可解释性技术
PyTorch计算机视觉模型解释Grad-CAM可视化Github开源项目热门
pytorch-grad-cam是一个先进的AI解释性工具包,适用于PyTorch平台,提供了多种像素归因方法,支持常见的CNN和视觉变换器模型。这个包不仅可以用于生产中对模型预测的诊断,也适用于模型开发阶段。通过包括平滑方法和高性能的批处理支持,pytorch-grad-cam能够在多种场景下提供详尽可靠的视觉解释,助力研究人员和开发者深入理解模型决策过程。
kornia - 高效、差分化的PyTorch计算机视觉库
KorniaPyTorch计算机视觉开源深度学习Github开源项目热门
Kornia是一款基于PyTorch的差分化计算机视觉库,提供一系列可插入神经网络的运算和模块,用于解决通用的计算机视觉问题。该库利用PyTorch高效性和自适应反向传播算法,支持图像变换、视觉几何、深度估算及基于张量的低层图像处理等功能,适用于研究和商业用途。
Conference-Acceptance-Rate - 顶级AI相关会议的录取率趋势
人工智能接受率会议论文计算机视觉Github开源项目热门
本项目详细汇总了顶级人工智能相关会议的录取率数据,包括自然语言处理、计算机视觉、机器学习、数据挖掘等领域。通过多年会议数据分析,提供对学术界趋势的深入洞见。适用于学者和研究人员规划提交论文,以及对AI研究领域发展感兴趣的读者。
sahi - 支持小物体检测和大图像推理的轻量级视觉工具库
SAHI对象检测实例分割计算机视觉yolov5Github开源项目
SAHI是一款轻量级视觉工具库,专注于解决小物体检测和大图像推理难题,支持多种框架如YOLOv5、MMDetection和Detectron2。提供丰富的命令行工具及COCO数据集处理功能,适用于精细化的计算机视觉应用,特别在复杂图像处理中表现优异。通过多种教程和示例,帮助开发者快速上手并优化视觉任务。
PyTorch-Tutorial-2nd - 涵盖深度学习应用与推理部署的知识库
PyTorch深度学习计算机视觉自然语言处理大语言模型Github开源项目
本书基于PyTorch,系统性涵盖深度学习的核心知识,包括计算机视觉、自然语言处理、大语言模型等实战案例,详解ONNX和TensorRT推理部署框架,为读者提供从基础到应用的完整指导,帮助快速掌握PyTorch并实现项目落地。适合AI自学者、产品经理及跨领域人士阅读。
learnopencv - 从OpenCV编程到实践深度学习技巧
LearnOpenCV计算机视觉深度学习AI教程Github开源项目
LearnOpenCV.com 博客提供了众多关于计算机视觉、深度学习及人工智能的最新技术和代码实例。该平台聚焦于为AI学习者及技术实践者提供丰富的资源和项目实践,帮助用户全面掌握并应用AI技术。
CVPR2024-Papers-with-Code - 探索CVPR 2024最新发布的计算机视觉论文与代码集锦
CVPR 2024计算机视觉人工智能机器学习深度学习Github开源项目
CVPR 2024的论文和代码集锦,涵盖3D建模、机器学习、视觉感知等多种计算机视觉领域,为研究人员和技术开发者提供一站式检索最新科研成果与实用工具。
Best_AI_paper_2020 - 2020年AI领域顶级研究论文与开源项目解析
人工智能AI论文深度学习机器学习计算机视觉Github开源项目
探索2020年AI研究的顶尖成果。本页面提供从计算机视觉到自然语言处理的最新AI研究论文,每篇论文均配有清晰视频讲解及深度分析链接,同时提供开源代码下载,助您深入了解AI技术如何塑造未来。
best_AI_papers_2021 - 2021年AI领域的重要研究成果及其应用
人工智能深度学习计算机视觉图像生成神经网络Github开源项目
best_AI_papers_2021项目精选2021年AI领域的关键研究,涵盖从伦理到技术实用性的多方面进展。探索每项研究的创新及其未来影响,包括视频讲解与相关代码。
Transformers-Recipe - 学习与应用Transformer的指南
TransformerNLP计算机视觉强化学习AttentionGithub开源项目
该指南为自然语言处理(NLP)及其他领域的学习者提供了丰富的Transformer学习资源,包括基础介绍、技术解析、实际实现和应用。通过精选的文章、视频和代码示例,帮助用户深入掌握Transformer模型的理论与实践。
computervision-recipes - 计算机视觉领域的实用示例和指南,涵盖面部识别、图像识别等多种视觉任务
计算机视觉图像识别PyTorchAzure模型部署Github开源项目
computervision-recipes为数据科学家和机器学习工程师提供计算机视觉领域的实用示例和指南,涵盖面部识别、图像识别等多种视觉任务,并便利地利用先进库加速从概念到实现的全过程,并在云端实现模型训练与部署。
albumentations - 提升深度学习模型质量的图像增强Python库
Albumentations图像增强深度学习计算机视觉Python库Github开源项目
Albumentations, 一个高效的Python库用于图像增强,通过逾70种方法优化深度学习和计算机视觉模型性能。支持PyTorch和TensorFlow框架,适合多种视觉任务如分类、语义分割和目标检测。
deep-learning-drizzle - 深度学习与AI在线课程
深度学习机器学习神经网络自然语言处理计算机视觉Github开源项目
deep-learning-drizzle 集结了全球顶尖院校与研究机构的深度学习与AI在线课程。覆盖初级到高级课程,涉及自然语言处理、计算机视觉、机器学习等多个领域,提供视频教程及实战操作指南。适合各层次人士学习,助您深入AI领域。
graph-based-deep-learning-literature - 探索基于图的深度学习最新文献与会议进展
图形深度学习NeurIPSICML计算机视觉数据挖掘Github开源项目
该项目收录了基于图的深度学习领域内,例如NeurIPS、ICML和ICLR等顶级会议的出版物、相关工作坊、综述文章、书籍以及软件资源链接。这些资源为学术研究人员和专业学者提供了方便的一站式服务,便于他们探索、查询及利用该领域内的最新科研成果和工具。
pytorch-deep-learning - 深入PyTorch的深度学习实用教程
PyTorch深度学习神经网络计算机视觉迁移学习Github开源项目
本课程涵盖从基础到高级的深度学习概念,通过实践教学与丰富的视频材料,讲解PyTorch操作和应用。包括神经网络分类、计算机视觉和数据集处理等主题,适合希望深化机器学习理解和应用的学习者。课程包括最新的PyTorch 2.0教程,确保内容的时效性和专业性。
Awesome-MIM - 掩码图像建模在自监督表示学习中的应用与发展
Masked Image Modeling自监督学习计算机视觉Transformer深度学习Github开源项目
该项目汇总了掩码图像建模(MIM)及相关的自监督学习方法。涵盖了从2008年以来的主要自监督学习研究,并展示了其在自然语言处理和计算机视觉领域的发展历程和关键节点。所有内容按时间顺序排列并定期更新,包括相关论文、代码和框架的详细信息,旨在帮助研究者深入理解和应用MIM方法。欢迎贡献相关文献或修正建议。
NLP-Natural-Language-Processing - 全面的自然语言处理资源与工具库
Natural Language Processing机器学习深度学习数据科学计算机视觉Github开源项目
提供全面的自然语言处理(NLP)资源,涵盖数据集、前沿技术、课程、书籍推荐、GitHub代码示例及流行工具。涉及数据分析、知识图谱、模型与算法、情感分析、主题建模等任务的详细资料与学习路径。了解最新NLP动态,探索自然语言处理的应用潜力。
ICCV2023-Papers-with-Code - ICCV 2023前沿计算机视觉论文与开源代码合集
ICCV 2023论文开源项目计算机视觉图像处理Github
收录ICCV 2023大会接受的2160篇论文及开源代码,涵盖计算机视觉领域的多个前沿主题,包括Backbone、CLIP、GAN、NeRF、扩散模型、自监督学习、目标检测和医学图像处理,为研究和学习者提供一站式资源。
computer-vision-in-action - 计算机视觉实战指南:涵盖基础理论及前沿技术
Maiwei AI LabCharmve计算机视觉机器学习L0CVGithub开源项目
本项目提供全面且前沿的计算机视觉学习资源,涵盖深度学习基础、神经网络模型及其优化方法。核心内容包括卷积神经网络、循环神经网络以及现代技术如Transformer、强化学习和迁移学习。通过实战项目和详细的代码实现,用户可以学习图像分类、目标检测、语义分割和3D重建等应用。此外,项目提供在线运行的notebook,简化本地调试过程。
Transformer-in-Computer-Vision - Transformer在计算机视觉中的最新研究汇总
Transformer计算机视觉最新论文深度学习视觉算法Github开源项目
项目汇总了最新的基于Transformer的计算机视觉研究论文,涵盖了视频处理、图像分类、目标检测和异常检测等广泛应用场景。用户可点击链接查看具体类别的论文和代码。若发现遗漏研究,欢迎提交问题或请求。最新版本更新于2024年8月8日,为科研人员与开发者提供丰富资源。
Transformer-in-Vision - 深入探索Transformer在计算机视觉领域的最新研究与资源
Transformer-in-VisionAI模型计算机视觉ChatGPT多模态Github开源项目
本页面收录并介绍了最新的基于Transformer的计算机视觉研究和相关资源,内容涵盖机器人应用、视频生成、文本-图像检索、多模态预训练模型等领域。用户可访问开源代码和论文链接,如ChatGPT在机器人领域的应用、DIFFUSIONDB、LAION-5B、LAVIS、Imagen Video和Phenaki等。页面会不定期更新,提供Transformer在视觉领域应用的全面信息和资源汇总。
inference - 简化了计算机视觉模型的部署的开源平台
Roboflow Inference计算机视觉模型部署YOLOv8开源平台Github开源项目
Roboflow Inference 是一个开源平台,简化了计算机视觉模型的部署。通过 Python 原生包、自托管推理服务器或托管的 API,开发者可以执行对象检测、分类和实例分割,并使用基础模型如 CLIP、Segment Anything 和 YOLO-World。平台提供了高级功能,如服务器部署、设备管理和主动学习。支持 GPU 加速环境,并提供详尽的文档和教程,帮助用户充分利用 Inference 包的功能。
raster-vision - 开源Python工具构建卫星和航空影像的计算机视觉模型
Raster Vision计算机视觉卫星图像深度学习PyTorchGithub开源项目
Raster Vision是一个开源的Python库和框架,用于构建卫星、航空和其他大型影像集的计算机视觉模型。它支持芯片分类、目标检测和语义分割,后端采用PyTorch。作为低代码框架,它允许用户无需深度学习专业知识即可配置和运行机器学习管道,并支持通过AWS Batch和AWS Sagemaker在云端进行部署。用户可以通过pip或Docker镜像进行安装和使用。更多详情参阅官方文档。
ImageAI - 使用简便的代码实现深度学习和计算机视觉功能的开源Python库
ImageAI计算机视觉深度学习对象检测自定义模型训练Github开源项目
ImageAI是一款开源的Python库,帮助开发者使用简便的代码实现深度学习和计算机视觉功能。该库支持图像预测、目标检测、视频检测及对象跟踪等多种功能。新版本引入了PyTorch后端和TinyYOLOv3模型训练,提升了性能并扩展了功能。用户还可以训练自定义模型识别新对象。有关如何安装和使用ImageAI的详细信息,请参阅项目文档和指南。
overeasy - 无数据集需求的定制视觉模型构建
Overeasy零样本视觉模型图像处理计算机视觉分割Github开源项目
Overeasy允许无大规模数据集,通过链式预训练零样本视觉模型实现高效图像处理。利用专用工具和工作流,用户可定制端到端管道,支持边框检测及分类。功能涵盖执行图和检测,安装简便,文档详尽,并提供Colab示例。
Diffusion-Models-Papers-Survey-Taxonomy - 扩散模型的全面方法与应用概述
Diffusion ModelsACM Computing Surveys算法分类计算机视觉自然语言处理Github开源项目
本文系统梳理了扩散模型的最新进展,涵盖算法和应用分类,包括计算机视觉、自然语言处理及医疗图像重建等领域。项目持续更新,整合最新研究成果。读者将收获从无监督学习到高分辨率图像生成及多模态学习的丰富知识,掌握这一前沿技术。
fastai - 一个为从业者提供快速提供在标准深度学习领域中提供最先进的高级组件,并提供可以混合和匹配的低级组件构建新方法的深度学习库
fastaiPyTorch深度学习计算机视觉GPU优化Github开源项目
fastai是一个深度学习库,提供高层组件以快速实现高性能结果,同时为研究人员提供可组合的低层组件。通过分层架构和Python、PyTorch的灵活性,fastai在不牺牲易用性、灵活性和性能的情况下,实现了高效的深度学习。支持多种安装方式,包括Google Colab和conda,适用于Windows和Linux。学习资源丰富,包括书籍、免费课程和详细文档。
相关文章
人工智能顶级会议录用率分析:从数据看AI研究的发展趋势
2024年08月30日
SmartOpenCV: 增强Android端OpenCV图像预览功能的开源库
2024年08月30日
SmartOpenCV: Android端OpenCV增强库的革新之作
2024年08月30日
OpenCV:开源计算机视觉库的领军者
2024年08月30日
Supervision: 强大的计算机视觉工具库
2024年08月30日
CVAT:开源计算机视觉标注工具的领军者
2024年08月30日
FiftyOne: 构建高质量数据集和计算机视觉模型的开源工具
2024年08月30日
GluonCV: 先进的计算机视觉深度学习工具包
2024年08月30日
PyTorch-Grad-CAM:计算机视觉的高级AI可解释性工具
2024年08月29日