單項(xiàng)選擇題

針對(duì)損失函數(shù)（lossfunction）的描述，何者為非？（）

A.是訓(xùn)練過(guò)程中用來(lái)度量分類(lèi)器輸出錯(cuò)誤程度的數(shù)學(xué)化表示
B.預(yù)測(cè)錯(cuò)誤程度越大，損失函數(shù)的取值就越大
C.定義合適的損失函數(shù)對(duì)于訓(xùn)練分類(lèi)器是非常重要的
D.損失函數(shù)是在整個(gè)訓(xùn)練集上求得的，如果用它來(lái)更新參數(shù)，則是利用了整個(gè)數(shù)據(jù)集中被誤分類(lèi)的數(shù)據(jù)
E.感知器和支持向量機(jī)是基于相同的損失函數(shù)建立起來(lái)的

你可能感興趣的試題

單項(xiàng)選擇題

何者敘述為非？（）

A.強(qiáng)化學(xué)習(xí)與監(jiān)督學(xué)習(xí)最主要的區(qū)別在于其收到的反饋是：評(píng)估性和指導(dǎo)性
B.監(jiān)督學(xué)習(xí)給出的指導(dǎo)性反饋將會(huì)通過(guò)監(jiān)督信號(hào)告知學(xué)習(xí)者應(yīng)該要做出什么樣的行為而獲取更高的收益
C.強(qiáng)化學(xué)習(xí)的評(píng)估性反饋意味著該學(xué)習(xí)系統(tǒng)只會(huì)告訴學(xué)習(xí)者當(dāng)前的做法是好還是壞的
D.強(qiáng)化學(xué)習(xí)的目的就是找到一個(gè)最佳的策略，從而使得主體發(fā)出一系列的動(dòng)作后，收到的累積回報(bào)最多
E.策略（Policy）指的是主體的行為，是一個(gè)從狀態(tài)集合到動(dòng)作集合的映像

單項(xiàng)選擇題

下棋網(wǎng)絡(luò)又稱(chēng)為策略網(wǎng)絡(luò)（policynetwork），該網(wǎng)絡(luò)接受當(dāng)前棋盤(pán)局面作為輸入，并輸出在當(dāng)前局面下選擇每個(gè)位置的落子（）？

A.方差
B.變異
C.機(jī)率
D.方向
E.平均值

針對(duì)損失函數(shù)（lossfunction）的描述，何者為非？（）

你可能感興趣的試題

何者敘述為非？（）

下棋網(wǎng)絡(luò)又稱(chēng)為策略網(wǎng)絡(luò)（policynetwork），該網(wǎng)絡(luò)接受當(dāng)前棋盤(pán)局面作為輸入，并輸出在當(dāng)前局面下選擇每個(gè)位置的落子（）？

針對(duì)損失函數(shù)（lossfunction）的描述，何者為非？（）

下棋網(wǎng)絡(luò)又稱(chēng)為策略網(wǎng)絡(luò)（policynetwork），該網(wǎng)絡(luò)接受當(dāng)前棋盤(pán)局面作為輸入，并輸出在當(dāng)前局面下選擇每個(gè)位置的落子（）？