A.反向傳播算法用于計算梯度,梯度下降算法用于更新參數(shù)B.反向傳播算法用于更新參數(shù),梯度下降算法用于計算梯度C.兩者都用于計算梯度,但梯度下降算法用于更新參數(shù)D.兩者可以獨立運行,互不影響
A.序列到序列模型B.注意力機制C.引入預(yù)訓(xùn)練模型D.數(shù)據(jù)增強
A.名稱B.位置C.屬性D.內(nèi)容