logo
Loading...

Sequence Generation - Cupoy

用 maximize likelihood(也可以稱為 minimize cross entropy)訓練 seq2seq model 的問題是 training criterion 很難選到合適的 RL的困難是:機器需要跟人、環境互動很多次,在真實情境很難實現-> alpha GO style 讓兩個機器自己互動,在這種方法中的問題是 evaluation function 是人定的,而定義出合適的 evaluation function 其實是很難的-> use GAN to improving 影片內容 pdf:http://speech.ee.ntu.edu.tw/~tlkagk/courses/MLDS_2018/Lecture/GANSeqNew.pdf

用 maximize likelihood(也可以稱為 minimize cross entropy)訓練 seq2seq model 的問題是 training criterion 很難選到合適的 RL的困難是:機器需要跟人、環境互動很多次,在真實情境很難實現-> alpha GO style 讓兩個機器自己互動,在這種方法中的問題是 evaluation function 是人定的,而定義出合適的 evaluation function 其實是很難的-> use GAN to improving 影片內容 pdf:http://speech.ee.ntu.edu.tw/~tlkagk/courses/MLDS_2018/Lecture/GANSeqNew.pdf