学习率调度

¶ 学习率调度

¶ 为什么需要学习率调度

¶ 固定步长衰减（Step Decay）

¶ 指数衰减（Exponential Decay）

¶ 余弦退火（Cosine Annealing）

¶ 学习率预热（Warmup）

¶ OneCycle 学习率策略

¶ 自适应学习率调度

¶ 主流调度策略对比总表

¶ 超参数调优指南

¶ 代码模板：通用的学习率调度器

¶ 学习率调度的理论视角

¶ 参考文献与拓展阅读