强化学习第二版导图（二）：时序差分及Bootstrapping

发表于 2022/03/18

作者 SeptemberHX

1 分钟阅读

本系列为 Sutton & Barto -《Reinforcement Learning: An Introduction 2nd Edition》的个人读后思维导图记录，便于后续快速复习及回忆，本章对应原文的第6-7章。原书地址：incompleteideas.net，右键新标签查看图片原图。

本文由作者按照 CC BY 4.0 进行授权

热门标签