#视觉任务

FastDeploy: 高效易用的深度学习模型部署工具包

3 个月前

FastDeploy AI模型部署 PaddlePaddle 视觉任务 NLP Github 开源项目

3 个月前

相关项目

YOLOMagic

YOLO Magic🚀 是一个基于YOLOv5的扩展项目，为视觉任务提供更强大的功能和简化的操作。该项目引入了多种网络模块，如空间金字塔模块、特征融合结构和新型骨干网络，并支持多种注意力机制。通过直观的网页界面，无需复杂的命令行操作即可轻松进行图像和视频推理。无论是初学者还是专业人员，YOLO Magic🚀都能提供出色的性能、强大的定制能力和广泛的社区支持。

FastDeploy

高性能AI模型部署工具，支持文本、视觉、语音及跨模态模型的优化，适用于云端、移动端和边缘设备。支持160多种模型，涵盖图像分类、目标检测、OCR、人脸检测、抠图、跟踪、NLP、语音合成等任务，满足多场景、多硬件、多平台的需求。

clip-japanese-base

该日语CLIP模型由LY Corporation开发，通过大约10亿对图文数据进行训练，适用于图像和文本的零样本分类与检索。该模型采用Eva02-B作为图像编码器，并使用12层BERT作为文本编码器。模型在图像分类中的准确率达到0.89，检索召回率为0.30。在评估中，使用了STAIR Captions和ImageNet-1K等数据集，表现优秀。模型已开源，遵循Apache 2.0协议。

theia-base-patch16-224-cddsv

Theia通过整合多种视觉模型如CLIP和ViT，增强机器人学习的视觉能力。该模型以DeiT-Tiny为基础，能够在较少的训练数据和较小的模型尺寸下，超越以往模型的表现，为自动化应用提供多样化的视觉知识支持。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com