單項選擇題

在強化學(xué)習(xí)中，什么是“策略”（）？

A.智能體選擇的動作序列
B.智能體根據(jù)狀態(tài)選擇動作的規(guī)則
C.智能體獲得的累積獎勵
D.智能體與環(huán)境交互的次數(shù)

你可能感興趣的試題

單項選擇題

以下哪個不是譜聚類的主要步驟（）？

A.構(gòu)建相似度矩陣
B.計算拉普拉斯矩陣
C.對拉普拉斯矩陣進(jìn)行特征分解
D.使用K-means 對特征向量進(jìn)行聚類

單項選擇題

在K-means 算法中，初始聚類中心的選擇對結(jié)果有何影響（）？

A.沒有影響
B.可能導(dǎo)致局部最優(yōu)解
C.一定導(dǎo)致全局最優(yōu)解
D.使算法收斂速度更快