<video id="6ers2"><th id="6ers2"></th></video>

<source id="6ers2"><del id="6ers2"></del></source>

單項(xiàng)選擇題

強(qiáng)化學(xué)習(xí)中近端策略?xún)?yōu)化（ProximalPolicyOptimization-PPO）的目的是：（）。

A.減少學(xué)習(xí)過(guò)程中的方差
B.加速模型的收斂速度
C.優(yōu)化策略的穩(wěn)定性
D.提高策略的探索能力

你可能感興趣的試題

單項(xiàng)選擇題

層次聚類(lèi)方法中，凝聚的層次聚類(lèi)是從什么開(kāi)始（）？

A.將每個(gè)數(shù)據(jù)點(diǎn)視為一個(gè)單獨(dú)的簇
B.將所有數(shù)據(jù)點(diǎn)視為一個(gè)簇
C.隨機(jī)選擇數(shù)據(jù)點(diǎn)作為簇
D.根據(jù)數(shù)據(jù)的分布選擇簇

單項(xiàng)選擇題

下列不屬于Keras 的核心模塊的是（）。

A.有激活函數(shù)
B.損失函數(shù)
C.濾波器
D.正則化器

<samp id="1ux77"><listing id="1ux77"><dl id="1ux77"></dl></listing></samp>

<video id="1ux77"><sup id="1ux77"></sup></video>