判斷題AdaGrad方法學習率是所有梯度歷史平方值總和的平方根的倒數(shù),具有損失大的特性。

您可能感興趣的試卷