强化学习第二版导图(一):MDP、动态规划及蒙特卡洛法 发表于 2021/09/11 作者 SeptemberHX 1 分钟阅读本系列为 Sutton & Barto -《Reinforcement Learning: An Introduction 2nd Edition》的个人读后思维导图记录,便于后续快速复习及回忆,本章对应原文的第1-5章。原书地址:incompleteideas.net,右键新标签查看图片原图。 学习, Reinforcement Learning 强化学习 思维导图 本文由作者按照 CC BY 4.0 进行授权 分享