文章

强化学习第二版导图(二):时序差分及Bootstrapping

本系列为 Sutton & Barto -《Reinforcement Learning: An Introduction 2nd Edition》的个人读后思维导图记录,便于后续快速复习及回忆,本章对应原文的第6-7章。原书地址:incompleteideas.net,右键新标签查看图片原图。

ReinforcementLearnning_6_7.png

本文由作者按照 CC BY 4.0 进行授权