#神经网络架构搜索

Llama-3_1-Nemotron-51B-Instruct - NVIDIA开发的高效大语言模型

模型神经网络架构搜索Llama-3开源项目Huggingface蒸馏Github大语言模型人工智能

Llama-3_1-Nemotron-51B-Instruct是NVIDIA开发的大语言模型，采用神经架构搜索方法平衡准确性和效率。该模型内存占用低，可在单个H100-80GB GPU上运行大型工作负载。模型在英语对话和编程方面表现出色，也支持非英语语言。经过安全评估和对抗性测试，适合商业应用。

fbnetc_100.rmsp_in1k - FBNetC-100：轻量级移动设备图像分类模型

FBNet模型图像分类神经网络架构搜索GithubtimmImageNet-1kHuggingface开源项目

fbnetc_100.rmsp_in1k是基于FBNet架构的轻量级图像分类模型，在ImageNet-1k数据集上训练。该模型仅有5.6M参数和0.4 GMACs，适用于224x224图像输入，专为移动设备优化。通过timm库，可轻松实现图像分类、特征图提取和图像嵌入等功能。模型采用RMSProp优化器和指数衰减学习率，平衡了性能和效率。

spnasnet_100.rmsp_in1k - 使用Single-Path NAS技术设计的轻量级图像分类模型

SPNasNetImageNet模型图像分类神经网络架构搜索GithubtimmHuggingface开源项目

spnasnet_100.rmsp_in1k是基于Single-Path NAS技术的轻量级图像分类模型，在ImageNet-1k数据集上训练。模型仅有440万参数和0.3 GMACs，适合资源受限场景。支持图像分类、特征图提取和图像嵌入等应用。通过timm库可轻松加载此预训练模型进行推理或微调。模型采用RMSProp优化器和指数衰减学习率调度，在保持高效性的同时确保了分类性能。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号