文章

强化学习第二版导图(一):MDP、动态规划及蒙特卡洛法

本系列为 Sutton & Barto -《Reinforcement Learning: An Introduction 2nd Edition》的个人读后思维导图记录,便于后续快速复习及回忆,本章对应原文的第1-5章。原书地址:incompleteideas.net,右键新标签查看图片原图。

强化学习1-5.png

本文由作者按照 CC BY 4.0 进行授权