项目简介
Intel® AI Reference Models 是由英特尔公司推出的一个开源项目,专注于提供优化后的机器学习模型、示例脚本、最佳实践及分步教程。这个资源库主要面向那些计划在 Intel® Xeon® 可扩展处理器和 Intel® 数据中心 GPU 上运行的流行开放源代码机器学习模型。为了简化实施过程,该项目提供了相关的容器,便于在这些环境中快速运行。
项目目的
英特尔通过贡献代码,优化了许多流行的深度学习框架,如 TensorFlow 和 PyTorch。此外,还附加了特定的插件和扩展,如 Intel Extension for TensorFlow 和 Intel Extension for PyTorch。这些优化旨在提升神经网络模型在常见数据集上的运行性能。Intel® AI Reference Models 的目标是快速重建软件环境,以展示最佳性能,并在适配英特尔硬件的平台上展示其 AI 能力。
值得注意的是,这些脚本并非英特尔平台的基准测试工具。更多关于英特尔平台的性能测试,可访问英特尔的官方网站。
数据集说明
虽然此项目中的模型可能引用了公共数据集,这些数据集由第三方提供,因此英特尔不承担数据的准确性或质量的责任。用户在访问这些数据集时,需遵守相关的数据使用条款。对于数据使用中可能产生的任何错误或数据依赖问题,英特尔不承担责任。
使用场景
项目中提供的模型主要运行在 Linux 系统下,有些模型也支持在 Windows 系统上的裸机运行。若需了解在 Windows 系统上使用该模型的更多信息,请查阅相应的文档。此外,还提供了在 Sapphire Rapids 等环境中的运行指导。
模型分类
项目提供了一系列的深度学习模型,涵盖了图像识别、图像分割、语言建模、语言翻译、目标检测、推荐、扩散及图网络等多个领域。每一类别模型都提供了详细的文档说明、支持的框架及操作模式,以及使用的基准数据集等信息。
如图像识别领域的 ResNet 50v1.5 模型,可在 TensorFlow 和 PyTorch 框架下进行推理和训练。同样,语音识别领域的 RNN-T 模型也支持在 PyTorch 框架中使用。这些模型结合英特尔的扩展插件,充分发挥了硬件的运算能力。
英特尔数据中心 GPU 工作负载
在使用英特尔数据中心 GPU 工作负载时,项目同样提供了详细的操作指南,并支持多个模型在 Flex、Max 以及 Arc 系列 GPU 上的训练和推理。为获得最佳性能,用户可以选择特定的扩展插件和支持精度模式进行模型操作。
贡献指南
对项目感兴趣并希望贡献自己力量的开发者,可以参阅贡献指南,进行新的基准测试脚本的添加。该项目致力于提供一个开放的环境,以实现持续的优化和创新。
此项目许可证遵循 Apache License Version 2.0,用户可以依据许可证条款自由使用和修改项目内容。通过这些努力,Intel® AI Reference Models 希望能成为一个有效的工具,为深度学习模型的广泛应用提供支持和便利。