差别
这里会显示出您选择的修订版和当前版本之间的差别。
| 后一修订版 | 前一修订版 | ||
| 深度学习:深度学习概述 [2026/03/02 20:06] – 创建 张叶安 | 深度学习:深度学习概述 [2026/03/02 21:00] (当前版本) – [计算题答案] 张叶安 | ||
|---|---|---|---|
| 行 269: | 行 269: | ||
| **样本1**:(2, | **样本1**:(2, | ||
| - | - 预测:$0 \times 2 + 0 \times 3 + 0 = 0$,预测为负类(错误) | + | |
| - | - 更新:$w_1 = 0 + 2 = 2$,$w_2 = 0 + 3 = 3$,$b = 0 + 1 = 1$ | + | - 更新:$w_1 = 0 + 2 = 2$,$w_2 = 0 + 3 = 3$,$b = 0 + 1 = 1$ |
| **样本2**:(1, | **样本2**:(1, | ||
| - | - 预测:$2 \times 1 + 3 \times 1 + 1 = 6 > 0$,预测为正类(正确) | + | |
| - | - 不更新 | + | - 不更新 |
| **样本3**:(-1, | **样本3**:(-1, | ||
| - | - 预测:$2 \times (-1) + 3 \times (-2) + 1 = -7 < 0$,预测为负类(正确) | + | |
| - | - 不更新 | + | - 不更新 |
| **样本4**:(0, | **样本4**:(0, | ||
| - | - 预测:$2 \times 0 + 3 \times (-1) + 1 = -2 < 0$,预测为负类(正确) | + | |
| - | - 不更新 | + | - 不更新 |
| 第二轮检查所有样本均分类正确,算法收敛。 | 第二轮检查所有样本均分类正确,算法收敛。 | ||
| 行 298: | 行 298: | ||
| 优势: | 优势: | ||
| - | - 能够处理高维医学影像数据(CT、MRI、X光等) | + | |
| - | - 可以学习复杂的病变特征模式 | + | - 可以学习复杂的病变特征模式 |
| - | - 能够辅助医生提高诊断效率和准确性 | + | - 能够辅助医生提高诊断效率和准确性 |
| - | - 可以7x24小时工作,缓解医疗资源不足问题 | + | - 可以7x24小时工作,缓解医疗资源不足问题 |
| 挑战: | 挑战: | ||
| - | - 需要大量高质量标注的医学影像数据 | + | |
| - | - 模型可解释性要求高,医生和患者需要理解决策依据 | + | - 模型可解释性要求高,医生和患者需要理解决策依据 |
| - | - 不同医院设备差异导致的数据分布偏移 | + | - 不同医院设备差异导致的数据分布偏移 |
| - | - 误诊的法律责任界定 | + | - 误诊的法律责任界定 |
| **(2) 自动驾驶** | **(2) 自动驾驶** | ||
| 优势: | 优势: | ||
| - | - 可以同时处理多源传感器数据(摄像头、雷达、激光雷达) | + | |
| - | - 能够实时感知周围环境,识别车辆、行人、交通标志 | + | - 能够实时感知周围环境,识别车辆、行人、交通标志 |
| - | - 反应速度快于人类驾驶员 | + | - 反应速度快于人类驾驶员 |
| - | - 不会疲劳、分心或情绪化 | + | - 不会疲劳、分心或情绪化 |
| 挑战: | 挑战: | ||
| - | - 安全性要求极高,任何错误都可能导致严重后果 | + | |
| - | - 需要处理极端天气、复杂交通等边缘情况 | + | - 需要处理极端天气、复杂交通等边缘情况 |
| - | - 伦理困境(如不可避免的碰撞时的决策) | + | - 伦理困境(如不可避免的碰撞时的决策) |
| - | - 法规和标准尚未完善 | + | - 法规和标准尚未完善 |
| **(3) 金融信贷审批** | **(3) 金融信贷审批** | ||
| 优势: | 优势: | ||
| - | - 可以整合多维度数据(信用记录、消费行为、社交网络等) | + | |
| - | - 能够发现传统模型难以捕捉的非线性关系 | + | - 能够发现传统模型难以捕捉的非线性关系 |
| - | - 审批效率高,可以实时决策 | + | - 审批效率高,可以实时决策 |
| - | - 降低人工审批的主观偏见 | + | - 降低人工审批的主观偏见 |
| 挑战: | 挑战: | ||
| - | - 模型可能从历史数据中学习到歧视性偏见 | + | |
| - | - 需要满足金融监管的公平性和透明性要求 | + | - 需要满足金融监管的公平性和透明性要求 |
| - | - 黑盒特性使得解释拒绝原因困难 | + | - 黑盒特性使得解释拒绝原因困难 |
| - | - 对抗攻击可能导致欺诈性申请被通过 | + | - 对抗攻击可能导致欺诈性申请被通过 |
| ===== 1.7 训练题 ===== | ===== 1.7 训练题 ===== | ||
| 行 372: | 行 372: | ||
| ==== 填空题 ==== | ==== 填空题 ==== | ||
| + | < | ||
| - | 6. 深度学习的核心特征是使用______神经网络来学习数据的层次化表示。 | + | 6. 深度学习的核心特征是使用"______"神经网络来学习数据的层次化表示。 |
| - | 7. 万能近似定理指出,具有至少一个隐藏层的前馈神经网络可以近似任何______函数。 | + | 7. 万能近似定理指出,具有至少一个隐藏层的前馈神经网络可以近似任何"______"函数。 |
| - | 8. 在监督学习中,训练数据包含输入特征和对应的______。 | + | 8. 在监督学习中,训练数据包含输入特征和对应的"______"。 |
| - | 9. Sigmoid函数的主要缺点是当输入值很大或很小时会产生______问题。 | + | 9. Sigmoid函数的主要缺点是当输入值很大或很小时会产生"______"问题。 |
| - | + | ||
| - | 10. Transformer架构完全基于______机制,摒弃了循环结构。 | + | |
| + | 10. Transformer架构完全基于" | ||
| + | </ | ||
| ==== 计算题 ==== | ==== 计算题 ==== | ||
| 11. 一个神经元有四个输入$x_1=1.0$、$x_2=-0.5$、$x_3=0.3$、$x_4=-0.8$,权重$w_1=0.5$、$w_2=0.3$、$w_3=-0.2$、$w_4=0.4$,偏置$b=-0.1$。请计算: | 11. 一个神经元有四个输入$x_1=1.0$、$x_2=-0.5$、$x_3=0.3$、$x_4=-0.8$,权重$w_1=0.5$、$w_2=0.3$、$w_3=-0.2$、$w_4=0.4$,偏置$b=-0.1$。请计算: | ||
| - | | + | |
| - | (2) 使用Tanh激活函数的输出 | + | (1) 加权和$z$ |
| - | (3) 使用Softmax(假设这是3分类中的第2类,其他两个输入分别为0.5和0.3)的输出概率 | + | |
| + | (2) 使用Tanh激活函数的输出 | ||
| + | |||
| + | (3) 使用Softmax(假设这是3分类中的第2类,其他两个输入分别为0.5和0.3)的输出概率 | ||
| 12. 给定训练样本:(1, | 12. 给定训练样本:(1, | ||
| 行 427: | 行 431: | ||
| 11. **解答**: | 11. **解答**: | ||
| | | ||
| - | | + | (1) 加权和: |
| - | $$z = 0.5 \times 1.0 + 0.3 \times (-0.5) + (-0.2) \times 0.3 + 0.4 \times (-0.8) - 0.1$$ | + | |
| - | $$z = 0.5 - 0.15 - 0.06 - 0.32 - 0.1 = -0.13$$ | + | $$z = 0.5 \times 1.0 + 0.3 \times (-0.5) + (-0.2) \times 0.3 + 0.4 \times (-0.8) - 0.1$$ |
| + | |||
| + | $$z = 0.5 - 0.15 - 0.06 - 0.32 - 0.1 = -0.13$$ | ||
| | | ||
| - | | + | (2) Tanh输出: |
| - | $$y = \tanh(-0.13) = \frac{e^{-0.13} - e^{0.13}}{e^{-0.13} + e^{0.13}} \approx \frac{0.878 - 1.139}{0.878 + 1.139} \approx -0.129$$ | + | |
| + | $$y = \tanh(-0.13) = \frac{e^{-0.13} - e^{0.13}}{e^{-0.13} + e^{0.13}} \approx \frac{0.878 - 1.139}{0.878 + 1.139} \approx -0.129$$ | ||
| | | ||
| - | | + | (3) Softmax概率: |
| - | 三个输入值:0.5、-0.13(当前神经元)、0.3 | + | |
| - | $$\text{分母} = e^{0.5} + e^{-0.13} + e^{0.3} = 1.649 + 0.878 + 1.350 = 3.877$$ | + | 三个输入值:0.5、-0.13(当前神经元)、0.3 |
| - | $$P(\text{第2类}) = \frac{e^{-0.13}}{3.877} = \frac{0.878}{3.877} \approx 0.226$$ | + | |
| + | $$\text{分母} = e^{0.5} + e^{-0.13} + e^{0.3} = 1.649 + 0.878 + 1.350 = 3.877$$ | ||
| + | |||
| + | $$P(\text{第2类}) = \frac{e^{-0.13}}{3.877} = \frac{0.878}{3.877} \approx 0.226$$ | ||
| 12. **解答**: | 12. **解答**: | ||
| | | ||
| - | | + | **样本1**:(1, |
| - | - 计算:$0.1 \times 1 + (-0.1) \times 2 + 0 = 0.1 - 0.2 = -0.1 < 0$,预测负类(错误) | + | - 计算:$0.1 \times 1 + (-0.1) \times 2 + 0 = 0.1 - 0.2 = -0.1 < 0$,预测负类(错误) |
| - | - 更新:$w_1 = 0.1 + 0.5 \times 1 = 0.6$,$w_2 = -0.1 + 0.5 \times 2 = 0.9$,$b = 0 + 0.5 = 0.5$ | + | - 更新:$w_1 = 0.1 + 0.5 \times 1 = 0.6$,$w_2 = -0.1 + 0.5 \times 2 = 0.9$,$b = 0 + 0.5 = 0.5$ |
| | | ||
| - | | + | **样本2**:(-1, |
| - | - 计算:$0.6 \times (-1) + 0.9 \times (-1) + 0.5 = -0.6 - 0.9 + 0.5 = -1.0 < 0$,预测负类(正确) | + | - 计算:$0.6 \times (-1) + 0.9 \times (-1) + 0.5 = -0.6 - 0.9 + 0.5 = -1.0 < 0$,预测负类(正确) |
| - | - 不更新 | + | - 不更新 |
| | | ||
| - | | + | **样本3**:(2, |
| - | - 计算:$0.6 \times 2 + 0.9 \times 1 + 0.5 = 1.2 + 0.9 + 0.5 = 2.6 > 0$,预测正类(正确) | + | - 计算:$0.6 \times 2 + 0.9 \times 1 + 0.5 = 1.2 + 0.9 + 0.5 = 2.6 > 0$,预测正类(正确) |
| - | - 不更新 | + | - 不更新 |
| | | ||
| - | | + | **一轮迭代后参数**:$w_1 = 0.6$,$w_2 = 0.9$,$b = 0.5$ |
| - | --- | ||
| - | **本章完** | ||