强化学习第二版导图（一）：MDP、动态规划及蒙特卡洛法

发表于 2021/09/11

作者 SeptemberHX

1 分钟阅读

本系列为 Sutton & Barto -《Reinforcement Learning: An Introduction 2nd Edition》的个人读后思维导图记录，便于后续快速复习及回忆，本章对应原文的第1-5章。原书地址：incompleteideas.net，右键新标签查看图片原图。

本文由作者按照 CC BY 4.0 进行授权

热门标签