#ConvNeXT
convnext-xlarge-384-22k-1k - 融合现代设计的高性能图像分类卷积神经网络
计算机视觉神经网络图像分类深度学习Huggingface模型ConvNeXTGithub开源项目
ConvNeXT是一种创新的纯卷积神经网络模型,结合了ResNet的现代化设计和Swin Transformer的先进理念。该模型在ImageNet-22k数据集上进行了大规模预训练,并在ImageNet-1k上以384x384分辨率精细调优,展现出卓越的图像分类性能。ConvNeXT不仅适用于各类计算机视觉任务,还凸显了传统卷积网络在当代人工智能领域的持续价值和潜力。
convnext-large-384 - ConvNeXT模型在图像分类中的创新突破
图像分类HuggingfaceImageNetVision TransformersGithub开源项目模型ResNetConvNeXT
ConvNeXT是一个受Vision Transformers启发的卷积模型,通过在ImageNet-1k上以384x384分辨率训练而成,旨在提高图像分类效果。研究显示,该模型在性能上优于传统模型,并基于ResNet进行了现代化改造。开发者Liu等人在相关论文中介绍了这一模型,该模型可用于分类任务,亦可在Hugging Face平台上进行任务微调。
convnext-tiny-224 - 高效图像分类 ConvNeXT卷积神经网络的新突破
图像分类HuggingfaceVision TransformersImageNetGithub开源项目模型ResNetConvNeXT
ConvNeXT是一款卷积模型,具有优于Vision Transformers的表现。设计灵感源于Swin Transformer,并对ResNet进行了现代化调整,专注于图像分类。ConvNeXT-tiny-224在ImageNet-1k数据集训练后,提供高效的分类能力。模型集线器提供适用不同任务的微调版本。