<img src=https://github.com/sb-ai-lab/Eco2AI/blob/main/images/photo_2022-06-14_13-02-37.jpg />
Eco2AI
关于Eco2AI :clipboard:
<img src=https://github.com/sb-ai-lab/Eco2AI/blob/main/images/eco2ai_logo_cut.jpg />
Eco2AI是一个用于跟踪CO2排放的Python库。它监控CPU和GPU设备的能耗,并根据地区排放系数估算等效碳排放量。 Eco2AI适用于所有Python脚本,您只需在代码中添加几行即可。所有排放数据和设备信息都会记录在本地文件中。
每次运行Tracker()都会在日志文件中添加一个会话描述,包括以下元素:
- 项目名称
- 实验描述
- 开始时间
- 持续时间(秒)
- 能耗(kWh)
- CO2排放量(kg)
- CPU名称
- GPU名称
- 操作系统
- 国家
安装
要安装eco2AI库,请运行以下命令:
pip install eco2ai
使用示例
eco2AI使用示例 您也可以在YouTube上找到eco2AI教程
eco2AI的接口非常简单。以下是最简单的使用示例:
import eco2ai
tracker = eco2ai.Tracker(project_name="您的项目名称", experiment_description="训练<您的模型>模型")
tracker.start()
<您的GPU和(或)CPU计算>
tracker.stop()
eco2AI还支持装饰器。一旦执行装饰的函数,排放信息将被写入emission.csv文件:
from eco2ai import track
@track
def train_func(model, dataset, optimizer, epochs):
...
train_func(your_model, your_dataset, your_optimizer, your_epochs)
为了方便起见,每次您使用自定义参数实例化Tracker对象时,这些设置将被保存,直到库被删除。每个新的跟踪器都将使用您的自定义设置创建(如果您使用新参数创建跟踪器,它们将替代旧的参数)。例如:
import eco2ai
tracker = eco2ai.Tracker(
project_name="您的项目名称",
experiment_description="训练<您的模型>模型",
file_name="emission.csv"
)
tracker.start()
<您的GPU和(或)CPU计算>
tracker.stop()
...
# 现在,我们要为新的计算创建一个新的跟踪器
tracker = eco2ai.Tracker()
# 现在,它等同于:
# tracker = eco2ai.Tracker(
# project_name="您的项目名称",
# experiment_description="训练<您的模型>模型",
# file_name="emission.csv"
# )
tracker.start()
<您的GPU和(或)CPU计算>
tracker.stop()
您也可以使用set_params()函数设置参数,如下例所示:
from eco2ai import set_params, Tracker
set_params(
project_name="我的默认项目名称",
experiment_description="我们训练了...",
file_name="我的排放文件.csv"
)
tracker = Tracker()
# 现在,它等同于:
# tracker = Tracker(
# project_name="我的默认项目名称",
# experiment_description="我们训练了...",
# file_name="我的排放文件.csv"
# )
tracker.start()
<您的代码>
tracker.stop()
重要提示
如果出于某些原因无法确定国家,那么排放系数将设为436.529千克/兆瓦时,这是全球平均水平。 全球电力评估
为了正确计算GPU和CPU的功耗,您应该在使用任何GPU或CPU之前创建一个"跟踪器"。
每次新的计算都要创建一个新的"跟踪器"。
Eco2AI的使用
一个使用该库的示例在这篇文章中给出。在该论文中,我们展示了使用eco2AI跟踪等效CO2排放的实验,这些实验是在训练具有13亿参数(Malevich, ruDALL-E XL 1.3B)和120亿参数(Kandinsky, ruDALL-E XL 12B)的ruDALL-E模型时进行的。这些是多模态预训练的transformer模型,它们学习了图像的条件分布,通过一些描述所需结果的俄语文本提示,能够生成任意图像。 下表给出了在Emojis数据集上对Malevich和Kandinsky进行微调时准确记录的碳排放和功耗。
模型 | 训练时间 | 功耗, 千瓦时 | CO2, 千克 | GPU | CPU | 批次大小 |
---|---|---|---|---|---|---|
Malevich | 4小时19分 | 1.37 | 0.33 | A100显卡, 1块 | AMD EPYC 7742 64核 | 4 |
Kandinsky | 9小时45分 | 24.50 | 5.89 | A100显卡, 8块 | AMD EPYC 7742 64核 | 12 |
我们还展示了使用优化版GELU激活函数训练Malevich的结果。使用8位版本的GELU训练Malevich可以让我们节省约10%的能源,从而产生更少的等效CO2排放。
引用Eco2AI
Eco2AI使用Apache许可证2.0授权。
如果在任何研究论文中使用Eco2AI库,请考虑引用以下论文:
@article{eco2AI,
title={eco2AI: Carbon Emissions Tracking of Machine Learning Models as the First Step Towards Sustainable AI},
url={https://doi.org/10.1134/S1064562422060230}, DOI={10.1134/S1064562422060230},
journal={Doklady Mathematics},
author={Budennyy, S. A. and Lazarev, V. D. and Zakharenko, N. N. and Korovin, A. N. and Plosskaya, O. A. and Dimitrov, D. V. and Akhripkin, V. S. and Pavlov, I. V. and Oseledets, I. V. and Barsola, I. S. and Egorov, I. V. and Kosterina, A. A. and Zhukov, L. E.}, year={2023}, month=jan, language={en}}