yolos-fashionpedia

时尚领域物品检测的精细化模型

Huggingface YOLOS 模型微调开源项目模型 Github Fashionpedia 时尚物体检测

该模型专注于时尚领域的目标检测，识别多种服饰及配饰类别，包括衬衫、外套、帽子、鞋等。采用微调后的YOLOS架构，并使用Fashionpedia数据集训练，为时尚分析提供准确的识别功能。实现细节可在项目源码查看。

Github

Huggingface

介绍相关项目

fashion-clip - 专为时尚领域优化的对比语言视觉学习模型

CLIPFashionCLIPGithubHugging Face开源项目时尚行业模型

FashionCLIP是一个为时尚行业优化的CLIP模型，用于提升商品检索、分类和时尚分析的表现。通过超过70万对图像和文本数据进行微调，FashionCLIP在零样本场景下表现出色。更新版FashionCLIP 2.0采用更多训练数据，显著提高了FMNIST、KAGL和DEEP数据集的性能。项目提供开源代码和模型权重，可在Hugging Face上获取，并支持多种API和教程便于上手。

yolos-small-finetuned-license-plate-detection - 车牌识别微调模型提升物体检测能力

GithubHuggingfaceYOLOS开源项目模型模型微调目标检测视觉Transformer车牌识别

YOLOS小型模型经过微调适用于车牌检测，使用5200张图片进行训练，并在380张图片上验证，实现49.0的平均精度。模型支持PyTorch平台，并通过Python代码执行对象检测与边界框预测。其此前版本曾在ImageNet-1k和COCO 2017数据集上进行训练，具备卓越的识别性能。

multimodal-garment-designer - 利用多模态潜变量扩散模型进行人类为中心的时尚图像编辑

Dress CodeGithubMultimodal Garment DesignerVITON-HD开源项目时尚图像编辑潜在扩散模型

本项目通过多模态条件时尚图像编辑，优化服装设计流程，生成符合文本、人体姿势和服装草图等多种输入模态的时尚图像。采用的新架构基于潜变量扩散模型，并且扩展了Dress Code和VITON-HD数据集，实验结果显示该方法在图像现实性和输入一致性方面效果显著。更多详情请参阅官方文档及GitHub仓库。

yolov10x - 高效的实时端到端物体检测工具

GithubHuggingfacePyTorchYOLOv10对象检测开源项目模型深度学习计算机视觉

YOLOv10是一个高效的端到端物体检测开源项目，支持在COCO等数据集上进行准确的训练和验证。通过整合PyTorch模型资源，用户可简便地安装和应用。本项目支持从预训练模型进行迁移学习，适合多种计算机视觉应用需求，是追求速度与精度的理想选择。

dress-code - 高分辨率虚拟试衣数据集，涵盖53792件服装和107584张图像

Deep LearningDress Code DatasetGithubOpenPose图像分割开源项目虚拟试穿

Dress Code数据集提供高分辨率的虚拟试衣图像，包含来自YOOX NET-A-PORTER目录的53792件服装和107584张图像。数据集分为上身、下身和连衣裙三类，分辨率为1024x768，并附有关键点、骨架图、人类标签图和稠密姿态信息。请注意，使用此数据集需遵守相关条款，且仅对非私人公司开放。更多信息，请访问相关链接。

DAMO-YOLO - 基于YOLO系列和嵌入包括神经网络架构搜索及轻量级算法在内的多项新技术的对象检测算法

DAMO-YOLOGithub开源项目性能优化检测模型目标检测算法更新

DAMO-YOLO, 阿里巴巴DAMO实验室的先进对象检测技术，基于YOLO系列和嵌入包括神经网络架构搜索及轻量级算法在内的多项新技术，以优化性能和效率。针对广泛行业场景，提供一站式解决方案，从训练到部署全面支持。

LeYOLO - 可扩展高效的目标检测CNN架构

COCO数据集GithubLeYOLO开源项目目标检测神经网络计算效率

LeYOLO是一种新型目标检测模型系列，通过创新的CNN架构设计实现了计算效率与准确性的优化平衡。该模型引入高效主干网络缩放、快速金字塔架构网络和解耦网络中的网络检测头，大幅降低计算负载。在COCO验证集上，LeYOLO-Small仅使用4.5 GFLOP就达到38.2%的mAP，比YOLOv9-Tiny减少42%计算量。LeYOLO系列具有强大可扩展性，适用于从超低计算需求(<1 GFLOP)到高效高性能(>4 GFLOPs)的多种场景。

yolor - 改进的多任务统一网络实时对象检测模型

GithubYOLORYOLOv4多任务学习对象检测开源项目深度学习

该项目实现了一个新型多任务统一网络，基于最新论文支持多任务并在COCO数据集中的实时对象检测上表现出色。优化后的YOLOR模型在测试和验证中均显示出较高的AP值和运行速度，适用于多种实时应用场景。项目提供了详细的安装、训练和测试指南，支持Docker和Colab环境，适合研究人员和开发者在复杂场景中进行高效的对象检测。

YOLO-World - 下一代实时开放词汇目标检测模型

GithubYOLO-World开放词汇开源项目目标检测零样本学习预训练模型

YOLO-World是一款创新的实时开放词汇目标检测模型。经过大规模数据集预训练,它展现出卓越的开放词汇检测和定位能力。采用'先提示后检测'范式,YOLO-World通过重参数化技术实现高效的自定义词汇推理。该模型支持零样本目标检测、分割等多种任务,并开源了在线演示、预训练权重和微调代码,为计算机视觉领域提供了实用的研究与应用工具。

segformer_b2_clothes - SegFormer B2服装和人体语义分割模型

GithubHuggingfaceSegFormer人体分割图像分割开源项目模型衣物分割语义分割

这个开源项目利用SegFormer B2模型在ATR数据集上进行微调，实现了服装和人体分割功能。模型可识别17个语义类别，包括背景、服饰部件和身体部位。评估显示模型平均IoU为0.69，在多数类别中表现良好。项目还提供了简洁的示例代码，便于研究人员和开发者在实际应用中快速部署。

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com