單項選擇題

強化學習算法中,用于優(yōu)化策略的一種方法是:()。

A.監(jiān)督學習
B.無監(jiān)督學習
C.半監(jiān)督學習
D.策略梯度

微信掃碼免費搜題