差别

这里会显示出您选择的修订版和当前版本之间的差别。

--- 深度学习:深度学习概述 [2026/03/02 20:06] – 创建张叶安
+++ 深度学习:深度学习概述 [2026/03/02 21:00] (当前版本) – [计算题答案] 张叶安
@@ 行 269: / 行 269: @@
 **样本1**：(2, 3)，正例
-- 预测：$0 \times 2 + 0 \times 3 + 0 = 0$，预测为负类（错误）
+  - 预测：$0 \times 2 + 0 \times 3 + 0 = 0$，预测为负类（错误）
-- 更新：$w_1 = 0 + 2 = 2$，$w_2 = 0 + 3 = 3$，$b = 0 + 1 = 1$
+  - 更新：$w_1 = 0 + 2 = 2$，$w_2 = 0 + 3 = 3$，$b = 0 + 1 = 1$
 **样本2**：(1, 1)，正例
-- 预测：$2 \times 1 + 3 \times 1 + 1 = 6 > 0$，预测为正类（正确）
+  - 预测：$2 \times 1 + 3 \times 1 + 1 = 6 > 0$，预测为正类（正确）
-- 不更新
+  - 不更新
 **样本3**：(-1, -2)，负例
-- 预测：$2 \times (-1) + 3 \times (-2) + 1 = -7 < 0$，预测为负类（正确）
+  - 预测：$2 \times (-1) + 3 \times (-2) + 1 = -7 < 0$，预测为负类（正确）
-- 不更新
+  - 不更新
 **样本4**：(0, -1)，负例
-- 预测：$2 \times 0 + 3 \times (-1) + 1 = -2 < 0$，预测为负类（正确）
+  - 预测：$2 \times 0 + 3 \times (-1) + 1 = -2 < 0$，预测为负类（正确）
-- 不更新
+  - 不更新
 第二轮检查所有样本均分类正确，算法收敛。
@@ 行 298: / 行 298: @@
 优势：
-- 能够处理高维医学影像数据（CT、MRI、X光等）
+  - 能够处理高维医学影像数据（CT、MRI、X光等）
-- 可以学习复杂的病变特征模式
+  - 可以学习复杂的病变特征模式
-- 能够辅助医生提高诊断效率和准确性
+  - 能够辅助医生提高诊断效率和准确性
-- 可以7x24小时工作，缓解医疗资源不足问题
+  - 可以7x24小时工作，缓解医疗资源不足问题
 挑战：
-- 需要大量高质量标注的医学影像数据
+  - 需要大量高质量标注的医学影像数据
-- 模型可解释性要求高，医生和患者需要理解决策依据
+  - 模型可解释性要求高，医生和患者需要理解决策依据
-- 不同医院设备差异导致的数据分布偏移
+  - 不同医院设备差异导致的数据分布偏移
-- 误诊的法律责任界定
+  - 误诊的法律责任界定
 **(2) 自动驾驶**
 优势：
-- 可以同时处理多源传感器数据（摄像头、雷达、激光雷达）
+  - 可以同时处理多源传感器数据（摄像头、雷达、激光雷达）
-- 能够实时感知周围环境，识别车辆、行人、交通标志
+  - 能够实时感知周围环境，识别车辆、行人、交通标志
-- 反应速度快于人类驾驶员
+  - 反应速度快于人类驾驶员
-- 不会疲劳、分心或情绪化
+  - 不会疲劳、分心或情绪化
 挑战：
-- 安全性要求极高，任何错误都可能导致严重后果
+  - 安全性要求极高，任何错误都可能导致严重后果
-- 需要处理极端天气、复杂交通等边缘情况
+  - 需要处理极端天气、复杂交通等边缘情况
-- 伦理困境（如不可避免的碰撞时的决策）
+  - 伦理困境（如不可避免的碰撞时的决策）
-- 法规和标准尚未完善
+  - 法规和标准尚未完善
 **(3) 金融信贷审批**
 优势：
-- 可以整合多维度数据（信用记录、消费行为、社交网络等）
+  - 可以整合多维度数据（信用记录、消费行为、社交网络等）
-- 能够发现传统模型难以捕捉的非线性关系
+  - 能够发现传统模型难以捕捉的非线性关系
-- 审批效率高，可以实时决策
+  - 审批效率高，可以实时决策
-- 降低人工审批的主观偏见
+  - 降低人工审批的主观偏见
 挑战：
-- 模型可能从历史数据中学习到歧视性偏见
+  - 模型可能从历史数据中学习到歧视性偏见
-- 需要满足金融监管的公平性和透明性要求
+  - 需要满足金融监管的公平性和透明性要求
-- 黑盒特性使得解释拒绝原因困难
+  - 黑盒特性使得解释拒绝原因困难
-- 对抗攻击可能导致欺诈性申请被通过
+  - 对抗攻击可能导致欺诈性申请被通过
 ===== 1.7 训练题 =====
@@ 行 372: / 行 372: @@
 ==== 填空题 ====
+<code>
-. 深度学习的核心特征是使用______神经网络来学习数据的层次化表示。
+. 深度学习的核心特征是使用"______"神经网络来学习数据的层次化表示。
-. 万能近似定理指出，具有至少一个隐藏层的前馈神经网络可以近似任何______函数。
+. 万能近似定理指出，具有至少一个隐藏层的前馈神经网络可以近似任何"______"函数。
-. 在监督学习中，训练数据包含输入特征和对应的______。
+. 在监督学习中，训练数据包含输入特征和对应的"______"。
-. Sigmoid函数的主要缺点是当输入值很大或很小时会产生______问题。
+. Sigmoid函数的主要缺点是当输入值很大或很小时会产生"______"问题。
-. Transformer架构完全基于______机制，摒弃了循环结构。
+. Transformer架构完全基于"______"机制，摒弃了循环结构。
+</code>
 ==== 计算题 ====
 . 一个神经元有四个输入$x_1=1.0$、$x_2=-0.5$、$x_3=0.3$、$x_4=-0.8$，权重$w_1=0.5$、$w_2=0.3$、$w_3=-0.2$、$w_4=0.4$，偏置$b=-0.1$。请计算：
-    (1) 加权和$z$
-    (2) 使用Tanh激活函数的输出
+(1) 加权和$z$
-    (3) 使用Softmax（假设这是3分类中的第2类，其他两个输入分别为0.5和0.3）的输出概率
+(2) 使用Tanh激活函数的输出
+(3) 使用Softmax（假设这是3分类中的第2类，其他两个输入分别为0.5和0.3）的输出概率
 . 给定训练样本：(1, 2)为正类，(-1, -1)为负类，(2, 1)为正类。使用感知器算法，初始权重$w_1=0.1$、$w_2=-0.1$、$b=0$，学习率$\eta=0.5$，请进行一轮迭代并给出更新后的参数。
@@ 行 427: / 行 431: @@
 . **解答**：
-    (1) 加权和：
+(1) 加权和：
-    $$z = 0.5 \times 1.0 + 0.3 \times (-0.5) + (-0.2) \times 0.3 + 0.4 \times (-0.8) - 0.1$$
-    $$z = 0.5 - 0.15 - 0.06 - 0.32 - 0.1 = -0.13$$
+$$z = 0.5 \times 1.0 + 0.3 \times (-0.5) + (-0.2) \times 0.3 + 0.4 \times (-0.8) - 0.1$$
+$$z = 0.5 - 0.15 - 0.06 - 0.32 - 0.1 = -0.13$$
-    (2) Tanh输出：
+(2) Tanh输出：
-    $$y = \tanh(-0.13) = \frac{e^{-0.13} - e^{0.13}}{e^{-0.13} + e^{0.13}} \approx \frac{0.878 - 1.139}{0.878 + 1.139} \approx -0.129$$
+$$y = \tanh(-0.13) = \frac{e^{-0.13} - e^{0.13}}{e^{-0.13} + e^{0.13}} \approx \frac{0.878 - 1.139}{0.878 + 1.139} \approx -0.129$$
-    (3) Softmax概率：
+(3) Softmax概率：
-    三个输入值：0.5、-0.13（当前神经元）、0.3
-    $$\text{分母} = e^{0.5} + e^{-0.13} + e^{0.3} = 1.649 + 0.878 + 1.350 = 3.877$$
+三个输入值：0.5、-0.13（当前神经元）、0.3
-    $$P(\text{第2类}) = \frac{e^{-0.13}}{3.877} = \frac{0.878}{3.877} \approx 0.226$$
+$$\text{分母} = e^{0.5} + e^{-0.13} + e^{0.3} = 1.649 + 0.878 + 1.350 = 3.877$$
+$$P(\text{第2类}) = \frac{e^{-0.13}}{3.877} = \frac{0.878}{3.877} \approx 0.226$$
 . **解答**：
-    **样本1**：(1, 2)，正类
+**样本1**：(1, 2)，正类
-    - 计算：$0.1 \times 1 + (-0.1) \times 2 + 0 = 0.1 - 0.2 = -0.1 < 0$，预测负类（错误）
+  - 计算：$0.1 \times 1 + (-0.1) \times 2 + 0 = 0.1 - 0.2 = -0.1 < 0$，预测负类（错误）
-    - 更新：$w_1 = 0.1 + 0.5 \times 1 = 0.6$，$w_2 = -0.1 + 0.5 \times 2 = 0.9$，$b = 0 + 0.5 = 0.5$
+  - 更新：$w_1 = 0.1 + 0.5 \times 1 = 0.6$，$w_2 = -0.1 + 0.5 \times 2 = 0.9$，$b = 0 + 0.5 = 0.5$
-    **样本2**：(-1, -1)，负类
+**样本2**：(-1, -1)，负类
-    - 计算：$0.6 \times (-1) + 0.9 \times (-1) + 0.5 = -0.6 - 0.9 + 0.5 = -1.0 < 0$，预测负类（正确）
+  - 计算：$0.6 \times (-1) + 0.9 \times (-1) + 0.5 = -0.6 - 0.9 + 0.5 = -1.0 < 0$，预测负类（正确）
-    - 不更新
+  - 不更新
-    **样本3**：(2, 1)，正类
+**样本3**：(2, 1)，正类
-    - 计算：$0.6 \times 2 + 0.9 \times 1 + 0.5 = 1.2 + 0.9 + 0.5 = 2.6 > 0$，预测正类（正确）
+  - 计算：$0.6 \times 2 + 0.9 \times 1 + 0.5 = 1.2 + 0.9 + 0.5 = 2.6 > 0$，预测正类（正确）
-    - 不更新
+  - 不更新
-    **一轮迭代后参数**：$w_1 = 0.6$，$w_2 = 0.9$，$b = 0.5$
+**一轮迭代后参数**：$w_1 = 0.6$，$w_2 = 0.9$，$b = 0.5$
----
-**本章完**

Detach Close

您访问的页面并不存在。如果允许，您可以使用创建该页面按钮来创建它。

差别

该主题尚不存在

张叶安的博客