Project Icon

pytorch-lr-finder

PyTorch学习率范围测试工具

pytorch-lr-finder是一个基于PyTorch的学习率范围测试工具,实现了Leslie N. Smith论文中的方法和fastai的改进版本。通过在预训练阶段调整学习率,帮助用户确定最佳学习率。工具支持梯度累积和混合精度训练,适用于多种深度学习任务。简洁的API和可视化功能便于优化神经网络训练过程。

PyTorch学习率查找器

codecov

这是Leslie N. Smith在《用于训练神经网络的循环学习率》中详细介绍的学习率范围测试的PyTorch实现,以及fastai使用的改进版本。

学习率范围测试是一种提供有关最佳学习率的宝贵信息的测试。在预训练运行期间,学习率在两个边界之间线性或指数增加。较低的初始学习率允许网络开始收敛,随着学习率的增加,最终会变得过大,导致网络发散。

通常,在下降的损失曲线中间可以找到一个良好的静态学习率。在下面的图中,这个值为lr = 0.002

对于循环学习率(也在Leslie Smith的论文中详细介绍),学习率在两个边界(start_lr, end_lr)之间循环,作者建议将损失开始下降的点作为start_lr,将损失停止下降或变得不规则的点作为end_lr。在下面的图中,start_lr = 0.0002end_lr=0.2

学习率范围测试

安装

Python 3.5及以上版本:

pip install torch-lr-finder

安装支持混合精度训练的版本(详见此部分):

pip install torch-lr-finder -v --global-option="apex"

实现细节和使用方法

fastai的改进版本

以指数方式增加学习率,并计算每个学习率的训练损失。lr_finder.plot()绘制训练损失与对数学习率的关系图。

from torch_lr_finder import LRFinder

model = ...
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=1e-7, weight_decay=1e-2)
lr_finder = LRFinder(model, optimizer, criterion, device="cuda")
lr_finder.range_test(trainloader, end_lr=100, num_iter=100)
lr_finder.plot() # 检查损失-学习率图
lr_finder.reset() # 将模型和优化器重置为初始状态

Leslie Smith的方法

线性增加学习率,并计算每个学习率的评估损失。lr_finder.plot()绘制评估损失与学习率的关系图。 这种方法通常可以产生更精确的曲线,因为评估损失对发散更敏感,但测试时间明显更长,尤其是在评估数据集较大的情况下。

from torch_lr_finder import LRFinder

model = ...
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.1, weight_decay=1e-2)
lr_finder = LRFinder(model, optimizer, criterion, device="cuda")
lr_finder.range_test(trainloader, val_loader=val_loader, end_lr=1, num_iter=100, step_mode="linear")
lr_finder.plot(log_lr=False)
lr_finder.reset()

注意事项

  • examples文件夹中可以找到CIFAR10和MNIST的示例。
  • 传递给LRFinder的优化器不应附加LRScheduler
  • LRFinder.range_test()会改变模型权重和优化器参数。可以通过LRFinder.reset()将两者恢复到初始状态。
  • 可以通过lr_finder.history访问学习率和损失历史。这将返回一个包含lrloss键的字典。
  • 使用step_mode="linear"时,学习率范围应在同一数量级内。
  • LRFinder.range_test()期望从传递给它的DataLoader对象返回一对input, labelinput必须准备好传递给模型,label必须准备好传递给criterion,无需进行任何进一步的数据处理/处理/转换。如果您发现需要变通方法,可以使用TrainDataLoaderIterValDataLoaderIter类在DataLoader和训练/评估循环之间执行任何数据处理/处理/转换。您可以在examples/lrfinder_cifar10_dataloader_iter中找到如何使用这些类的示例。

额外的训练支持

梯度累积

您可以在LRFinder.range_test()中设置accumulation_steps参数为适当的值来执行梯度累积:

from torch.utils.data import DataLoader
from torch_lr_finder import LRFinder

desired_batch_size, real_batch_size = 32, 4
accumulation_steps = desired_batch_size // real_batch_size

dataset = ...

# 注意`DataLoader`使用的`batch_size`
trainloader = DataLoader(dataset, batch_size=real_batch_size, shuffle=True)

model = ...
criterion = ...
optimizer = ...

# (可选)使用此设置,将自动采用`amp.scale_loss()`
# model, optimizer = amp.initialize(model, optimizer, opt_level='O1')

lr_finder = LRFinder(model, optimizer, criterion, device="cuda")
lr_finder.range_test(trainloader, end_lr=10, num_iter=100, step_mode="exp", accumulation_steps=accumulation_steps)
lr_finder.plot()
lr_finder.reset()

混合精度训练

现在支持apex.amptorch.amp,以下是示例:

  • 使用apex.amp

    from torch_lr_finder import LRFinder
    from apex import amp
    
    # 在运行`LRFinder`之前添加此行
    model, optimizer = amp.initialize(model, optimizer, opt_level='O1')
    
    lr_finder = LRFinder(model, optimizer, criterion, device='cuda', amp_backend='apex')
    lr_finder.range_test(trainloader, end_lr=10, num_iter=100, step_mode='exp')
    lr_finder.plot()
    lr_finder.reset()
    
  • 使用torch.amp

    from torch_lr_finder import LRFinder
    
    amp_config = {
        'device_type': 'cuda',
        'dtype': torch.float16,
    }
    grad_scaler = torch.cuda.amp.GradScaler()
    
    lr_finder = LRFinder(
        model, optimizer, criterion, device='cuda',
        amp_backend='torch', amp_config=amp_config, grad_scaler=grad_scaler
    )
    lr_finder.range_test(trainloader, end_lr=10, num_iter=100, step_mode='exp')
    lr_finder.plot()
    lr_finder.reset()
    

请注意,混合精度训练的好处需要具有张量核心的NVIDIA GPU(参见:NVIDIA/apex #297

此外,您可以尝试设置torch.backends.cudnn.benchmark = True来提高训练速度。(但它可能不适用于某些情况,请自行承担风险)

贡献和拉取请求

欢迎所有贡献,但首先请查看CONTRIBUTING.md

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号