深度学习:深度学习概述

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

后一修订版
前一修订版
深度学习:深度学习概述 [2026/03/02 20:06] – 创建 张叶安深度学习:深度学习概述 [2026/03/02 21:00] (当前版本) – [计算题答案] 张叶安
行 269: 行 269:
  
 **样本1**:(2, 3),正例 **样本1**:(2, 3),正例
-- 预测:$0 \times 2 + 0 \times 3 + 0 = 0$,预测为负类(错误) +  - 预测:$0 \times 2 + 0 \times 3 + 0 = 0$,预测为负类(错误) 
-- 更新:$w_1 = 0 + 2 = 2$,$w_2 = 0 + 3 = 3$,$b = 0 + 1 = 1$+  - 更新:$w_1 = 0 + 2 = 2$,$w_2 = 0 + 3 = 3$,$b = 0 + 1 = 1$
  
 **样本2**:(1, 1),正例 **样本2**:(1, 1),正例
-- 预测:$2 \times 1 + 3 \times 1 + 1 = 6 > 0$,预测为正类(正确) +  - 预测:$2 \times 1 + 3 \times 1 + 1 = 6 > 0$,预测为正类(正确) 
-- 不更新+  - 不更新
  
 **样本3**:(-1, -2),负例 **样本3**:(-1, -2),负例
-- 预测:$2 \times (-1) + 3 \times (-2) + 1 = -7 < 0$,预测为负类(正确) +  - 预测:$2 \times (-1) + 3 \times (-2) + 1 = -7 < 0$,预测为负类(正确) 
-- 不更新+  - 不更新
  
 **样本4**:(0, -1),负例 **样本4**:(0, -1),负例
-- 预测:$2 \times 0 + 3 \times (-1) + 1 = -2 < 0$,预测为负类(正确) +  - 预测:$2 \times 0 + 3 \times (-1) + 1 = -2 < 0$,预测为负类(正确) 
-- 不更新+  - 不更新
  
 第二轮检查所有样本均分类正确,算法收敛。 第二轮检查所有样本均分类正确,算法收敛。
行 298: 行 298:
  
 优势: 优势:
-- 能够处理高维医学影像数据(CT、MRI、X光等) +  - 能够处理高维医学影像数据(CT、MRI、X光等) 
-- 可以学习复杂的病变特征模式 +  - 可以学习复杂的病变特征模式 
-- 能够辅助医生提高诊断效率和准确性 +  - 能够辅助医生提高诊断效率和准确性 
-- 可以7x24小时工作,缓解医疗资源不足问题+  - 可以7x24小时工作,缓解医疗资源不足问题
  
 挑战: 挑战:
-- 需要大量高质量标注的医学影像数据 +  - 需要大量高质量标注的医学影像数据 
-- 模型可解释性要求高,医生和患者需要理解决策依据 +  - 模型可解释性要求高,医生和患者需要理解决策依据 
-- 不同医院设备差异导致的数据分布偏移 +  - 不同医院设备差异导致的数据分布偏移 
-- 误诊的法律责任界定+  - 误诊的法律责任界定
  
 **(2) 自动驾驶** **(2) 自动驾驶**
  
 优势: 优势:
-- 可以同时处理多源传感器数据(摄像头、雷达、激光雷达) +  - 可以同时处理多源传感器数据(摄像头、雷达、激光雷达) 
-- 能够实时感知周围环境,识别车辆、行人、交通标志 +  - 能够实时感知周围环境,识别车辆、行人、交通标志 
-- 反应速度快于人类驾驶员 +  - 反应速度快于人类驾驶员 
-- 不会疲劳、分心或情绪化+  - 不会疲劳、分心或情绪化
  
 挑战: 挑战:
-- 安全性要求极高,任何错误都可能导致严重后果 +  - 安全性要求极高,任何错误都可能导致严重后果 
-- 需要处理极端天气、复杂交通等边缘情况 +  - 需要处理极端天气、复杂交通等边缘情况 
-- 伦理困境(如不可避免的碰撞时的决策) +  - 伦理困境(如不可避免的碰撞时的决策) 
-- 法规和标准尚未完善+  - 法规和标准尚未完善
  
 **(3) 金融信贷审批** **(3) 金融信贷审批**
  
 优势: 优势:
-- 可以整合多维度数据(信用记录、消费行为、社交网络等) +  - 可以整合多维度数据(信用记录、消费行为、社交网络等) 
-- 能够发现传统模型难以捕捉的非线性关系 +  - 能够发现传统模型难以捕捉的非线性关系 
-- 审批效率高,可以实时决策 +  - 审批效率高,可以实时决策 
-- 降低人工审批的主观偏见+  - 降低人工审批的主观偏见
  
 挑战: 挑战:
-- 模型可能从历史数据中学习到歧视性偏见 +  - 模型可能从历史数据中学习到歧视性偏见 
-- 需要满足金融监管的公平性和透明性要求 +  - 需要满足金融监管的公平性和透明性要求 
-- 黑盒特性使得解释拒绝原因困难 +  - 黑盒特性使得解释拒绝原因困难 
-- 对抗攻击可能导致欺诈性申请被通过+  - 对抗攻击可能导致欺诈性申请被通过
  
 ===== 1.7 训练题 ===== ===== 1.7 训练题 =====
行 372: 行 372:
  
 ==== 填空题 ==== ==== 填空题 ====
 +<code>
  
-6. 深度学习的核心特征是使用______神经网络来学习数据的层次化表示。+6. 深度学习的核心特征是使用"______"神经网络来学习数据的层次化表示。
  
-7. 万能近似定理指出,具有至少一个隐藏层的前馈神经网络可以近似任何______函数。+7. 万能近似定理指出,具有至少一个隐藏层的前馈神经网络可以近似任何"______"函数。
  
-8. 在监督学习中,训练数据包含输入特征和对应的______。+8. 在监督学习中,训练数据包含输入特征和对应的"______"
  
-9. Sigmoid函数的主要缺点是当输入值很大或很小时会产生______问题。 +9. Sigmoid函数的主要缺点是当输入值很大或很小时会产生"______"问题。
- +
-10. Transformer架构完全基于______机制,摒弃了循环结构+
  
 +10. Transformer架构完全基于"______"机制,摒弃了循环结构。
 +</code>
 ==== 计算题 ==== ==== 计算题 ====
  
 11. 一个神经元有四个输入$x_1=1.0$、$x_2=-0.5$、$x_3=0.3$、$x_4=-0.8$,权重$w_1=0.5$、$w_2=0.3$、$w_3=-0.2$、$w_4=0.4$,偏置$b=-0.1$。请计算: 11. 一个神经元有四个输入$x_1=1.0$、$x_2=-0.5$、$x_3=0.3$、$x_4=-0.8$,权重$w_1=0.5$、$w_2=0.3$、$w_3=-0.2$、$w_4=0.4$,偏置$b=-0.1$。请计算:
-    (1) 加权和$z$ + 
-    (2) 使用Tanh激活函数的输出 +(1) 加权和$z$ 
-    (3) 使用Softmax(假设这是3分类中的第2类,其他两个输入分别为0.5和0.3)的输出概率+ 
 +(2) 使用Tanh激活函数的输出 
 + 
 +(3) 使用Softmax(假设这是3分类中的第2类,其他两个输入分别为0.5和0.3)的输出概率
  
 12. 给定训练样本:(1, 2)为正类,(-1, -1)为负类,(2, 1)为正类。使用感知器算法,初始权重$w_1=0.1$、$w_2=-0.1$、$b=0$,学习率$\eta=0.5$,请进行一轮迭代并给出更新后的参数。 12. 给定训练样本:(1, 2)为正类,(-1, -1)为负类,(2, 1)为正类。使用感知器算法,初始权重$w_1=0.1$、$w_2=-0.1$、$b=0$,学习率$\eta=0.5$,请进行一轮迭代并给出更新后的参数。
行 427: 行 431:
 11. **解答**: 11. **解答**:
          
-    (1) 加权和: +(1) 加权和: 
-    $$z = 0.5 \times 1.0 + 0.3 \times (-0.5) + (-0.2) \times 0.3 + 0.4 \times (-0.8) - 0.1$$ + 
-    $$z = 0.5 - 0.15 - 0.06 - 0.32 - 0.1 = -0.13$$+$$z = 0.5 \times 1.0 + 0.3 \times (-0.5) + (-0.2) \times 0.3 + 0.4 \times (-0.8) - 0.1$$ 
 + 
 +$$z = 0.5 - 0.15 - 0.06 - 0.32 - 0.1 = -0.13$$
          
-    (2) Tanh输出: +(2) Tanh输出: 
-    $$y = \tanh(-0.13) = \frac{e^{-0.13} - e^{0.13}}{e^{-0.13} + e^{0.13}} \approx \frac{0.878 - 1.139}{0.878 + 1.139} \approx -0.129$$+ 
 +$$y = \tanh(-0.13) = \frac{e^{-0.13} - e^{0.13}}{e^{-0.13} + e^{0.13}} \approx \frac{0.878 - 1.139}{0.878 + 1.139} \approx -0.129$$
          
-    (3) Softmax概率: +(3) Softmax概率: 
-    三个输入值:0.5、-0.13(当前神经元)、0.3 + 
-    $$\text{分母} = e^{0.5} + e^{-0.13} + e^{0.3} = 1.649 + 0.878 + 1.350 = 3.877$$ +三个输入值:0.5、-0.13(当前神经元)、0.3 
-    $$P(\text{第2类}) = \frac{e^{-0.13}}{3.877} = \frac{0.878}{3.877} \approx 0.226$$+ 
 +$$\text{分母} = e^{0.5} + e^{-0.13} + e^{0.3} = 1.649 + 0.878 + 1.350 = 3.877$$ 
 + 
 +$$P(\text{第2类}) = \frac{e^{-0.13}}{3.877} = \frac{0.878}{3.877} \approx 0.226$$
  
 12. **解答**: 12. **解答**:
          
-    **样本1**:(1, 2),正类 +**样本1**:(1, 2),正类 
-    - 计算:$0.1 \times 1 + (-0.1) \times 2 + 0 = 0.1 - 0.2 = -0.1 < 0$,预测负类(错误) +  - 计算:$0.1 \times 1 + (-0.1) \times 2 + 0 = 0.1 - 0.2 = -0.1 < 0$,预测负类(错误) 
-    - 更新:$w_1 = 0.1 + 0.5 \times 1 = 0.6$,$w_2 = -0.1 + 0.5 \times 2 = 0.9$,$b = 0 + 0.5 = 0.5$+  - 更新:$w_1 = 0.1 + 0.5 \times 1 = 0.6$,$w_2 = -0.1 + 0.5 \times 2 = 0.9$,$b = 0 + 0.5 = 0.5$
          
-    **样本2**:(-1, -1),负类 +**样本2**:(-1, -1),负类 
-    - 计算:$0.6 \times (-1) + 0.9 \times (-1) + 0.5 = -0.6 - 0.9 + 0.5 = -1.0 < 0$,预测负类(正确) +  - 计算:$0.6 \times (-1) + 0.9 \times (-1) + 0.5 = -0.6 - 0.9 + 0.5 = -1.0 < 0$,预测负类(正确) 
-    - 不更新+  - 不更新
          
-    **样本3**:(2, 1),正类 +**样本3**:(2, 1),正类 
-    - 计算:$0.6 \times 2 + 0.9 \times 1 + 0.5 = 1.2 + 0.9 + 0.5 = 2.6 > 0$,预测正类(正确) +  - 计算:$0.6 \times 2 + 0.9 \times 1 + 0.5 = 1.2 + 0.9 + 0.5 = 2.6 > 0$,预测正类(正确) 
-    - 不更新+  - 不更新
          
-    **一轮迭代后参数**:$w_1 = 0.6$,$w_2 = 0.9$,$b = 0.5$+**一轮迭代后参数**:$w_1 = 0.6$,$w_2 = 0.9$,$b = 0.5$ 
  
---- 
-**本章完** 

该主题尚不存在

您访问的页面并不存在。如果允许,您可以使用创建该页面按钮来创建它。

  • 深度学习/深度学习概述.1772453201.txt.gz
  • 最后更改: 2026/03/02 20:06
  • 张叶安