#MLP-Mixer

vision_transformer - 视觉Transformer和MLP-Mixer模型库高性能图像识别

Vision TransformerMLP-Mixer图像识别JAXFlaxGithub开源项目

项目包含多种视觉Transformer(ViT)和MLP-Mixer模型实现,提供ImageNet和ImageNet-21k预训练模型及JAX/Flax微调代码。通过交互式Colab笔记本可探索5万多个模型检查点。这些高性能图像分类模型代表了计算机视觉的前沿进展。

mixer_b16_224.goog_in21k_ft_in1k - MLP-Mixer架构的ImageNet预训练模型实现图像分类与特征提取

模型神经网络开源项目HuggingfaceMLP-Mixer图像分类ImageNetGithubtimm

mixer_b16_224.goog_in21k_ft_in1k是一个基于MLP-Mixer架构的图像分类模型，在ImageNet-21k预训练后在ImageNet-1k微调。该模型拥有5990万参数，处理224x224图像输入，可用于图像分类和特征提取。项目提供了简洁的代码示例，展示了模型在图像分类和特征提取任务中的应用。这个模型为计算机视觉研究提供了有力工具。

相关文章

Article Cover

Vision Transformer: 图像识别的变革性架构

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号