單項選擇題

Q-learning算法中的Q表(Q-table)的row表示什么?()

A.獎勵(reward)
B.環(huán)境(environment)
C.代理人(agent)
D.行動(action)
E.狀態(tài)(state)

微信掃碼免費(fèi)搜題