#神经网络架构搜索

Llama-3_1-Nemotron-51B-Instruct - NVIDIA开发的高效大语言模型
模型神经网络架构搜索Llama-3开源项目Huggingface蒸馏Github大语言模型人工智能
Llama-3_1-Nemotron-51B-Instruct是NVIDIA开发的大语言模型,采用神经架构搜索方法平衡准确性和效率。该模型内存占用低,可在单个H100-80GB GPU上运行大型工作负载。模型在英语对话和编程方面表现出色,也支持非英语语言。经过安全评估和对抗性测试,适合商业应用。
fbnetc_100.rmsp_in1k - FBNetC-100:轻量级移动设备图像分类模型
FBNet模型图像分类神经网络架构搜索GithubtimmImageNet-1kHuggingface开源项目
fbnetc_100.rmsp_in1k是基于FBNet架构的轻量级图像分类模型,在ImageNet-1k数据集上训练。该模型仅有5.6M参数和0.4 GMACs,适用于224x224图像输入,专为移动设备优化。通过timm库,可轻松实现图像分类、特征图提取和图像嵌入等功能。模型采用RMSProp优化器和指数衰减学习率,平衡了性能和效率。
spnasnet_100.rmsp_in1k - 使用Single-Path NAS技术设计的轻量级图像分类模型
SPNasNetImageNet模型图像分类神经网络架构搜索GithubtimmHuggingface开源项目
spnasnet_100.rmsp_in1k是基于Single-Path NAS技术的轻量级图像分类模型,在ImageNet-1k数据集上训练。模型仅有440万参数和0.3 GMACs,适合资源受限场景。支持图像分类、特征图提取和图像嵌入等应用。通过timm库可轻松加载此预训练模型进行推理或微调。模型采用RMSProp优化器和指数衰减学习率调度,在保持高效性的同时确保了分类性能。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号