李宏毅_DRL Lecture 3

2022年12月13日—AnotherWaytouseCritic:Q-Learning...表面上Q-function只能用來評估actor的好壞,但實際上有Q-function就可以實作RL,就可以決定要採取的action。

李宏毅_DRL Lecture 3

2022年12月13日 — Another Way to use Critic: Q-Learning ... 表面上Q-function只能用來評估actor的好壞,但實際上有Q-function就可以實作RL,就可以決定要採取的action。

相關分類資訊