强化学习第二版导图(二):时序差分及Bootstrapping 发表于 2022/03/18 作者 SeptemberHX 1 分钟阅读本系列为 Sutton & Barto -《Reinforcement Learning: An Introduction 2nd Edition》的个人读后思维导图记录,便于后续快速复习及回忆,本章对应原文的第6-7章。原书地址:incompleteideas.net,右键新标签查看图片原图。 学习, Reinforcement Learning 强化学习 思维导图 本文由作者按照 CC BY 4.0 进行授权 分享