#机器视觉

Google Colab共享笔记本:实现协作与限权的最佳实践

2024年08月31日

Google Colaboratory NLP 机器视觉 GAN 教程 Github 开源项目

2024年08月31日

MVision AI - 引领放射治疗领域的人工智能解决方案

2024年08月30日

机器视觉深度学习无人驾驶 SLAM技术计算机视觉 Github 开源项目

2024年08月30日

相关项目

shared_colab_notebooks

该项目旨在分享和存储各种Google Colab笔记本，包含了丰富的自然语言处理、计算机视觉和GANs领域的示例和教程。笔记本资源由作者创建或修改，适用于开发者和研究人员。用户可以找到Transformers细调、OCR自定义、3D照片修复和流媒体应用创建等实际案例，快速获取并分享高质量的Colab笔记本资源，加速科研与开发进程。

mask2former-swin-small-coco-instance

Mask2Former是一个基于COCO数据集的图像分割模型，采用Swin-Small作为基础架构。通过统一的掩码预测方法实现实例、语义和全景分割功能。该模型创新性地结合多尺度可变形注意力机制和掩码注意力技术，优化了计算效率。采用子采样点损失计算策略，使训练过程更加高效。

donut-base-finetuned-cord-v2

该模型采用Swin Transformer编码器和BART解码器架构，通过CORD数据集优化，实现了直接的图像到文本转换功能。模型跳过了传统OCR步骤，直接将文档图像编码为张量表示，再解码生成文本内容，简化了文档理解流程。

yolov5n-license-plate

基于YOLOv5架构开发的轻量级车牌检测模型，通过pip快速安装部署。模型支持自定义参数配置，包括置信度阈值和IoU阈值调节，并集成了数据增强功能。提供完整的模型加载、推理和微调接口，可用于实际车牌检测场景，在验证集上展现出较高的检测精度。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com