你可能感興趣的試題

一個(gè)強(qiáng)化學(xué)習(xí)模型，下列敘述何者為真？（）

A.一組可以動(dòng)態(tài)變化的狀態(tài)（state）。比如圍棋棋盤(pán)上的黑白子的分布位置，市場(chǎng)上的每支股票的價(jià)格
B.一組可以選取的動(dòng)作（action）。比如對(duì)于圍棋來(lái)說(shuō)，就是可以落子的位置；對(duì)于股票交易來(lái)說(shuō)，就是每個(gè)時(shí)間點(diǎn)，買(mǎi)入或者賣(mài)出的股票以及數(shù)量
C.一個(gè)可以和決策主體（agent）進(jìn)行交互的環(huán)境。這個(gè)環(huán)境會(huì)決定每個(gè)動(dòng)作后狀態(tài)如何變化。比如說(shuō)圍棋博弈中的對(duì)手，或者股票市場(chǎng)。在強(qiáng)化學(xué)習(xí)中，為了降低學(xué)習(xí)的代價(jià)，很多時(shí)后我們會(huì)使用一個(gè)通過(guò)機(jī)器模擬的環(huán)境，而不是以真實(shí)場(chǎng)景作為環(huán)境
D.回報(bào)（reward）規(guī)則。當(dāng)決策主體通過(guò)行動(dòng)狀態(tài)發(fā)生變化時(shí)，它會(huì)獲得回報(bào)或者受到懲罰
E.以上皆是

單項(xiàng)選擇題

以下關(guān)于計(jì)算機(jī)下棋程序的歷史說(shuō)法錯(cuò)誤的是？（）

A.1997年，IBM的超級(jí)計(jì)算機(jī)“深藍(lán)”擊敗國(guó)際象棋世界冠軍加里卡斯珀羅夫
B.2014年IBM旗下的DeepMind團(tuán)隊(duì)開(kāi)發(fā)了人工智能?chē)宄绦駻lphaGo
C.2015年10月，AlphaGo擊敗歐洲圍棋世界冠軍樊麾，成為第一個(gè)無(wú)需讓子即可擊敗圍棋職業(yè)選手的計(jì)算機(jī)圍棋程序
D.2016年3月，AlphaGo以4：1的成績(jī)擊敗圍棋世界冠軍，職業(yè)九段棋手李世乭
E.2017年5月，在中國(guó)烏鎮(zhèn)-阿爾法元（AlphaGoZero）以3：0的成績(jī)完勝圍棋世界冠軍柯潔

在人臉特征提取過(guò)程中，應(yīng)選第幾層的輸出作為描述該人臉的特征？（）

你可能感興趣的試題

一個(gè)強(qiáng)化學(xué)習(xí)模型，下列敘述何者為真？（）

以下關(guān)于計(jì)算機(jī)下棋程序的歷史說(shuō)法錯(cuò)誤的是？（）

在人臉特征提取過(guò)程中，應(yīng)選第幾層的輸出作為描述該人臉的特征？（）

一個(gè)強(qiáng)化學(xué)習(xí)模型，下列敘述何者為真？（）

以下關(guān)于計(jì)算機(jī)下棋程序的歷史說(shuō)法錯(cuò)誤的是？（）