A.選擇合適的損失函數(shù)B.選擇合適的Mini-batchsizeC.選擇合適的激活函數(shù)D.選擇合適的自適應(yīng)學(xué)習(xí)率
A.訓(xùn)練數(shù)據(jù)太少B.模型過于復(fù)雜C.訓(xùn)練時(shí)間過長D.使用了過多的正則化
A.梯度下降B.學(xué)習(xí)率調(diào)整C.權(quán)重初始化D.特征選擇