Logo

#梯度下降

Logo of EffectiveTensorflow
EffectiveTensorflow
本指南深入讲解 TensorFlow 2,包括基本概念、广播机制、符号计算和控制流操作等。探讨如何通过重载操作符和控制流来提升代码效率,与 NumPy 的兼容性增强了代码的可读性。同时,介绍了广播机制的优势与潜在缺点,并展示了如何在多设备上使用 TensorFlow 2 的新 API 高效地处理和优化大型神经网络。
Logo of schedule_free
schedule_free
Schedule-Free Learning是一种新型PyTorch优化器,无需预设训练停止时间。该方法通过结合插值和平均技术取代传统动量,提高训练效率。不依赖学习率递减调度,却能达到或超越先进调度方法的效果。支持AdamW和SGD版本,并提供实验性包装器,可与各种基础优化器兼容。这种灵活的优化方法为深度学习模型训练提供了新的可能性。