convnext-xlarge-384-22k-1k

融合现代设计的高性能图像分类卷积神经网络

计算机视觉神经网络图像分类深度学习 Huggingface 模型 ConvNeXT Github 开源项目

ConvNeXT是一种创新的纯卷积神经网络模型，结合了ResNet的现代化设计和Swin Transformer的先进理念。该模型在ImageNet-22k数据集上进行了大规模预训练，并在ImageNet-1k上以384x384分辨率精细调优，展现出卓越的图像分类性能。ConvNeXT不仅适用于各类计算机视觉任务，还凸显了传统卷积网络在当代人工智能领域的持续价值和潜力。

Github

Huggingface

介绍相关项目

resnext101_32x16d.fb_swsl_ig1b_ft_in1k - Instagram预训练的ResNeXt模型用于图像分类和特征提取

GithubHuggingfaceResNeXttimm图像分类开源项目模型深度学习预训练模型

该模型基于ResNeXt-B架构，在Instagram-1B数据集上进行半监督预训练，并在ImageNet-1k上微调。模型拥有1.94亿参数，接受224x224像素输入图像，适用于图像分类、特征图提取和图像嵌入任务。它采用ReLU激活函数、单层7x7卷积和池化，以及1x1卷积的shortcut连接。在ImageNet验证集上，模型达到83.35%的Top-1准确率，展现出优秀的性能。

CLIP-convnext_xxlarge-laion2B-s34B-b82K-augreg - 基于LAION-2B数据集的卷积神经网络达到79%零样本分类准确率

CLIPConvNextGithubHuggingface图像分类开源项目机器学习模型神经网络

CLIP ConvNeXt-XXLarge是一个在LAION-2B数据集上训练的大规模视觉语言模型，总参数量12亿，图像分辨率256x256。模型采用ConvNeXt-XXLarge图像结构和ViT-H-14规模的文本编码器，在ImageNet零样本分类上达到79%准确率。主要应用于图像分类、检索等研究任务。

eca_botnext26ts_256.c1_in1k - 基于ResNeXt架构的BotNet高效图像分类模型

BotNetGithubHuggingfaceImageNet-1ktimm图像分类开源项目模型特征提取

这是一个基于ResNeXt架构的BotNet图像分类模型，采用高效通道注意力机制。该模型在ImageNet-1k数据集上训练，使用SGD优化器和自适应梯度裁剪技术。模型包含1060万参数，支持256x256像素图像处理。除图像分类外，还可用于特征图提取和图像嵌入，适用于多种计算机视觉任务。

res2next50.in1k - 基于Res2Net架构的高效多尺度图像分类模型

GithubHuggingfaceResNettimm图像分类开源项目模型深度学习特征提取

res2next50.in1k是基于Res2Net架构的图像分类模型，在ImageNet-1k数据集上训练。该模型采用多尺度ResNet结构，参数量为2470万，计算复杂度为4.2 GMACs。它不仅可用于图像分类，还支持特征图提取和图像嵌入等任务。res2next50.in1k在性能和灵活性方面表现出色，适用于广泛的计算机视觉应用。研究人员可通过timm库便捷地使用和评估此模型。

edgenext_small.usi_in1k - 轻量级CNN-Transformer混合模型EdgeNeXt用于移动视觉应用

EdgeNeXtGithubHuggingfaceImageNet图像分类开源项目模型特征提取神经网络

edgenext_small.usi_in1k是一款轻量级CNN-Transformer混合模型，针对移动视觉应用优化。该模型在ImageNet-1k数据集上训练，参数量为5.6M，GMACs为1.3。它支持图像分类、特征图提取和图像嵌入等功能，结合CNN和Transformer优势，在保持性能的同时减少计算资源需求，适合在资源受限的移动设备上运行。

MedNeXt - 基于ConvNeXt的3D医学图像分割神经网络架构

3D医学图像分割ConvNeXt架构GithubMedNeXtnnUNet开源项目深度学习

MedNeXt是一种基于ConvNeXt设计的神经网络架构，专门用于3D医学图像分割。它针对稀疏标注的医学数据集进行了优化，提供灵活的使用方式。该项目包含完整模型和独立模块，可集成到其他流程中。MedNeXt基于nnUNet框架，支持梯度检查点等功能，适用于低内存设备训练大型模型。项目还提供了多种预定义架构大小和内核尺寸的选项。

upernet-convnext-small - 高效语义分割框架融合ConvNeXt技术

ConvNeXtGithubHuggingfaceUperNet图像分割开源项目模型计算机视觉语义分割

UperNet是一种结合ConvNeXt骨干网络的语义分割框架，融合了特征金字塔网络(FPN)和金字塔池化模块(PPM)。它能为每个像素生成语义标签，适用于场景理解和图像分割等计算机视觉任务。该模型提供多种预训练版本，可根据具体需求应用于不同场景。UperNet的设计旨在提高语义分割的准确性和效率，为研究人员和开发者提供了强大的图像分析工具。

nest_base_jx.goog_in1k - NesT模型：高精度图像分类的嵌套层次Transformer架构

GithubHuggingfaceImageNetNesT图像分类开源项目模型深度学习神经网络

NesT (Nested Hierarchical Transformer) 是一种创新的图像分类模型，在ImageNet-1k数据集上训练。该模型拥有6770万参数，支持图像分类、特征提取和图像嵌入等多种应用。NesT模型在JAX中原始训练，后被移植到PyTorch，展现出优秀的准确性、数据效率和可解释性，为计算机视觉领域提供了新的研究方向。

CLIP-convnext_base_w-laion2B-s13B-b82K-augreg - ConvNeXt-Base架构的CLIP模型用于高效图像分类

CLIPConvNeXtGithubHuggingfaceLAION-5B图像检索开源项目模型零样本图像分类

该项目提供了一系列基于ConvNeXt-Base架构的CLIP模型，在LAION-5B数据集子集上训练。这些模型作为ViT和ResNet的替代方案，在模型规模和图像分辨率方面展现出良好的可扩展性。经过13B样本训练，模型在ImageNet零样本分类任务中达到70.8%以上的top-1准确率，体现出较高的样本效率。这些模型可应用于零样本图像分类、图像文本检索等多种任务。

CLIP-convnext_base_w-laion2B-s13B-b82K - ConvNeXt CLIP模型在ImageNet零样本分类中达到70.8%以上准确率

CLIPConvNeXtGithubHuggingfaceLAION-5BOpenCLIP开源项目模型零样本图像分类

这是一系列基于LAION-5B数据集训练的CLIP ConvNeXt-Base模型。经过13B样本训练后，模型在ImageNet零样本分类中实现了70.8%以上的Top-1准确率，显示出比ViT-B/16更高的样本效率。模型使用timm的ConvNeXt-Base作为图像塔，并探索了增强图像增强和正则化的效果。作为首个在CLIP ViT-B/16和RN50x4规模下训练的ConvNeXt CLIP模型，它为零样本图像分类研究提供了新的选择。

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号