差别
这里会显示出您选择的修订版和当前版本之间的差别。
| 两侧同时换到之前的修订记录 前一修订版 | |||
| 深度学习:优化算法 [2026/03/02 21:48] – [计算题答案] 张叶安 | 深度学习:优化算法 [2026/03/02 21:49] (当前版本) – [4.4.1 大批量训练的挑战] 张叶安 | ||
|---|---|---|---|
| 行 177: | 行 177: | ||
| 增大批量大小可以提高计算效率(利用硬件并行性),但会带来挑战: | 增大批量大小可以提高计算效率(利用硬件并行性),但会带来挑战: | ||
| - | - **泛化性能下降**:大批量训练的测试误差通常更高 | + | |
| - | - **优化困难**:损失曲面更尖锐,容易陷入尖锐极小值 | + | - **优化困难**:损失曲面更尖锐,容易陷入尖锐极小值 |
| - | - **需要调整学习率**:大批量需要更大的学习率 | + | - **需要调整学习率**:大批量需要更大的学习率 |
| ==== 4.4.2 线性学习率缩放 ==== | ==== 4.4.2 线性学习率缩放 ==== | ||