#MLP-Mixer
vision_transformer - 视觉Transformer和MLP-Mixer模型库 高性能图像识别
Vision TransformerMLP-Mixer图像识别JAXFlaxGithub开源项目
项目包含多种视觉Transformer(ViT)和MLP-Mixer模型实现,提供ImageNet和ImageNet-21k预训练模型及JAX/Flax微调代码。通过交互式Colab笔记本可探索5万多个模型检查点。这些高性能图像分类模型代表了计算机视觉的前沿进展。
mixer_b16_224.goog_in21k_ft_in1k - MLP-Mixer架构的ImageNet预训练模型实现图像分类与特征提取
模型神经网络开源项目HuggingfaceMLP-Mixer图像分类ImageNetGithubtimm
mixer_b16_224.goog_in21k_ft_in1k是一个基于MLP-Mixer架构的图像分类模型,在ImageNet-21k预训练后在ImageNet-1k微调。该模型拥有5990万参数,处理224x224图像输入,可用于图像分类和特征提取。项目提供了简洁的代码示例,展示了模型在图像分类和特征提取任务中的应用。这个模型为计算机视觉研究提供了有力工具。