#计算机视觉
MambaVision:融合Mamba和Transformer的高效视觉骨干网络
opencv
OpenCV是开源的计算机视觉库,提供详尽的文档、在线课程和活跃的Q&A论坛。用户可在GitHub上报告问题和贡献代码,需遵循明确的贡献指南。此外,OpenCV支持提交社区项目和参与志愿者活动,通过多个平台获取最新的计算机视觉与AI动态。
supervision
Supervision 是一个模型无关的计算机视觉工具包,支持分类、检测和分割模型的集成。用户可以加载数据集、可视化检测结果并进行区域统计。该工具包提供了丰富的注释和数据集处理功能,适用于零售和交通管理等领域。了解更多关于使用 Supervision 加速计算机视觉应用开发的信息。
cvat
CVAT是一个计算机视觉的交互式视频和图像标注工具,被全球数万用户和企业广泛使用。提供免费在线版和自托管解决方案,支持Roboflow和HuggingFace集成。支持多种标注格式,并通过自动标注功能加速标注过程。企业用户可享受高级功能和专业支持服务。
skyvern
Skyvern结合大语言模型(LLMs)和计算机视觉,提供简单的API端点,实现大量网站的工作流自动化,解决传统方法的不稳定性。无需定制代码即可操作新网站,对布局变化具有抗性,并能在多个网站上应用相同工作流。Skyvern云版本让用户无需管理基础设施即可运行多个实例,并提供反机器人检测、代理网络和验证码解决方案。
daily-paper-computer-vision
该项目每日更新和整理计算机视觉、深度学习及机器学习领域的最新优质论文和项目,涵盖多个研究方向。内容涵盖从2017年至今的顶会顶刊论文列表和代码链接,为研究人员提供丰富的资源参考。
fiftyone
FiftyOne 是一款提升机器学习工作流的开源工具,通过可视化数据集和解读模型结果来提高效率。用户可用它处理复杂标签、评估模型、探索场景、识别错误模式和注释错误等。安装简便,可通过 pip 安装并运行示例代码快速上手。
gluon-cv
GluonCV是一个面向工程师、研究人员和学生的计算机视觉深度学习工具包,支持快速原型设计。其主要功能包括可复现SOTA结果的训练脚本、对PyTorch和MXNet框架的支持、大量预训练模型,以及简化实现的API设计和社区支持。用户还可以通过AutoGluon执行图像分类和目标检测任务。
monodepth2
本项目提供了PyTorch实现的代码,用于训练和测试深度估计模型。代码采用自监督学习方法,支持单目和立体图像的深度预测。提供多种预训练模型和自定义数据集,兼容不同的图像分辨率。适用于研究和非商业用途,包含详细的设置指南、训练和评估说明。用户可通过此项目高效开发和优化深度估计模型。
fastai
fastai是一个深度学习库,提供高层组件以快速实现高性能结果,同时为研究人员提供可组合的低层组件。通过分层架构和Python、PyTorch的灵活性,fastai在不牺牲易用性、灵活性和性能的情况下,实现了高效的深度学习。支持多种安装方式,包括Google Colab和conda,适用于Windows和Linux。学习资源丰富,包括书籍、免费课程和详细文档。