ai_and_memory_wall

AI与“记忆墙”项目介绍

项目背景

本项目是围绕“AI与记忆墙”（AI and Memory Wall）论文的数据集合，主要涉及计算机视觉（CV）、自然语言处理（NLP）和语音学习领域的最先进（SOTA）模型的内存占用和计算量（FLOPs）。项目通过对这些模型的参数数量、特征尺寸以及在推理和训练阶段的总FLOPs进行详细报告，帮助研究者深入了解当前模型的计算和内存需求。

自然语言处理（NLP）模型

在NLP领域，项目主要关注不同变种的Transformer模型。这些模型从BERT模型入手，分别计算了它们在训练和推理阶段的FLOPs，参数数量以及内存占用。这些信息让我们能清楚了解这些顶尖NLP模型在性能和资源消耗上的异同。

参数信息展示

项目为每个模型提供了详细的参数信息，包括序列标记尺寸（Token Size）、参数数量（#Params）、特征数量（#Features）、推理阶段的GFLOPs以及训练阶段的PFLOPs。例如，GPT-3模型在推理阶段需要740,000 GFLOPs，而在训练阶段则需要消耗310,000,000 PFLOPs。

计算机视觉（CV）模型

在CV领域，项目列出了多个重要的视觉模型，逐个分析它们的输入图像分辨率、参数数量、推理和训练阶段的GFLOPs和PFLOPs，从而对比这些模型的复杂程度和计算资源需求。

参数信息展示

例如，AlexNet需要1.4 GFLOPs用于推理，而ResNet152则需要23 GFLOPs。同时，训练阶段的资源消耗差异更大，InceptionV3在训练时需要100,000 PFLOPs，而DenseNet201仅需2,800 PFLOPs。

内存需求分析

除计算资源外，项目还提供了历年来不同SOTA模型所需的内存详细报告，包括存储参数所需的内存、优化算法相关的内存以及激活/特征内存等。通过这些信息，研究者可以更好地理解和优化内存使用问题。

示例分析

在2018年，BERT Large模型的总内存需求为18.34 GB，其中参数内存为1.32 GB，优化器内存为2.64 GB，激活内存则达到了14.38 GB。这反映出深度学习模型在提升性能的同时，也在内存消耗上带来了巨大挑战。

致谢

如果您认为此项目对您的研究工作有帮助，请引用以下论文：

Gholami A, Yao Z, Kim S, Mahoney MW, Keutzer K. AI and Memory Wall. RiseLab Medium Blog Post, University of California Berkeley, 2021, March 29.

此项目通过量化分析和数据支持，为研究者提供了对复杂AI模型内存和计算需求的准确认识，进而帮助设计更高效的AI解决方案。

AI与“记忆墙”项目介绍

项目背景

自然语言处理（NLP）模型

参数信息展示

计算机视觉（CV）模型

参数信息展示

内存需求分析

示例分析

致谢

编辑推荐精选

openai-agents-python

Hunyuan3D-2

3FS

TRELLIS

ai-agents-for-beginners

AEE

UI-TARS-desktop

Wan2.1

爱图表

Qwen2.5-VL

探索AI的无限可能

推荐工具精选

豆包MarsCode

豆包

Trae

宣小二

讯飞绘镜

讯飞文书

阿里绘蛙

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号