差别

这里会显示出您选择的修订版和当前版本之间的差别。

--- 深度学习:强化学习 [2026/03/03 13:14] – [13.7.3 计算题] 张叶安
+++ 深度学习:强化学习 [2026/03/03 13:15] (当前版本) – [13.7.3 计算题] 张叶安
@@ 行 459: / 行 459: @@
 . 使用Q-Learning（$\alpha=0.2$，$\gamma=0.9$），当前Q表如下：
 | 状态 | 动作1 | 动作2  |
 | S1   | 5.0   | 3.0   |

Detach Close

您访问的页面并不存在。如果允许，您可以使用创建该页面按钮来创建它。

该主题尚不存在