深度学习:优化算法

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录 前一修订版
深度学习:优化算法 [2026/03/02 21:48] – [计算题答案] 张叶安深度学习:优化算法 [2026/03/02 21:49] (当前版本) – [4.4.1 大批量训练的挑战] 张叶安
行 177: 行 177:
 增大批量大小可以提高计算效率(利用硬件并行性),但会带来挑战: 增大批量大小可以提高计算效率(利用硬件并行性),但会带来挑战:
  
-- **泛化性能下降**:大批量训练的测试误差通常更高 +  - **泛化性能下降**:大批量训练的测试误差通常更高 
-- **优化困难**:损失曲面更尖锐,容易陷入尖锐极小值 +  - **优化困难**:损失曲面更尖锐,容易陷入尖锐极小值 
-- **需要调整学习率**:大批量需要更大的学习率+  - **需要调整学习率**:大批量需要更大的学习率
  
 ==== 4.4.2 线性学习率缩放 ==== ==== 4.4.2 线性学习率缩放 ====

该主题尚不存在

您访问的页面并不存在。如果允许,您可以使用创建该页面按钮来创建它。

  • 深度学习/优化算法.1772459318.txt.gz
  • 最后更改: 2026/03/02 21:48
  • 张叶安