A.智能體選擇的動作序列B.智能體根據(jù)狀態(tài)選擇動作的規(guī)則C.智能體獲得的累積獎勵D.智能體與環(huán)境交互的次數(shù)
A.構(gòu)建相似度矩陣B.計算拉普拉斯矩陣C.對拉普拉斯矩陣進(jìn)行特征分解D.使用K-means 對特征向量進(jìn)行聚類
A.沒有影響B.可能導(dǎo)致局部最優(yōu)解C.一定導(dǎo)致全局最優(yōu)解D.使算法收斂速度更快