logo
Loading...

什麼是 Actor Critic? - Cupoy

今天我們會來說說強化學習中的一種結合體Actor Critic (演員評判家), 它合併了以值為基礎(比如Q learning) 和以動作概率為基礎(比如Policy Gradients) 兩類強化學習算法. 詳細的文字教程: https://morvanzhou.github.io/tutoria... 來源:https://morvanzhou.github.io/tutorials/machine-learning/ML-intro/4-08-AC/

今天我們會來說說強化學習中的一種結合體Actor Critic (演員評判家), 它合併了以值為基礎(比如Q learning) 和以動作概率為基礎(比如Policy Gradients) 兩類強化學習算法. 詳細的文字教程: https://morvanzhou.github.io/tutoria... 來源:https://morvanzhou.github.io/tutorials/machine-learning/ML-intro/4-08-AC/