也就是有些變量可能被轉換成numpy數組,仍然可以參與計算,但是失去了梯度傳播的能力,導致無法將梯度傳播到後面的變量。
2.學習率的設定不合理。
學習率設置過高容易造成loss變成nan,導致模型不收斂,設置過小會導致模型學習緩慢。
3.神經網絡層的參數未正確初始化。
因為參數初始化會影響模型的訓練速度。
4.神經網絡層的參數不分級。
如果不進行梯度裁剪,可能會導致梯度爆炸,使模型無法將有效梯度傳播回去。
5.培訓次數不足
只有在學習足夠多之後,模型才能學習到好的特征。如果模型的訓練過早中止,模型將不會學習到好的特征。
6.訓練批次中樣本數量過少,導致損失值波動,從而造成模型不收斂的假象。
2022年6月26日回答
搶第壹個贊
熱心公益的網民
值得壹看的相關信息推薦。
廣告
老人智能設備,超值的好東西好賣,去淘寶買放心!
老人大嗓門,大按鍵,長待機居家看護病人,老人緊急救助者,壹鍵撥號緊急手機呼機,老人手機居家壹鍵呼叫報警器
380元
新款老人手機,老人長待機,大音量大屏幕移動聯通電信老人機
188元
AGM H2軍用三防智能手機4G全網通抗摔防水老人機移動聯通電信大語音大字體超長待機老人機手機
1799元
紐曼M560C老人機超長待機移動老年手機正品女按鍵直板老機小手機大屏大字大語音退網功能機電信老年手機。
357元
軍用三防智能手機全網通4G超長待機電霸老大爺大字大屏老大爺機
936元
女性吃魚膠好嗎?魚膠適合什麽樣的人?吃魚膠好不好?
值得壹看的魚膠推薦信息。
寧波宇鑫健康管理有限公司廣告
更多專家
模型不收斂的原因
專家1在線答疑到1。
5分鐘內回復| 10,000名專業受訪者
馬上提問
《最美的煙火》問了壹個教育問題,做了壹個好評。
藍秋旺子咨詢了壹個教育問題,做了好評。
大蒜咨詢了壹個教育問題,做了好評。
188 * * * 8493咨詢了壹個教育問題,好評。
籃球大圖咨詢了壹個教育問題,發表了很好的評論。
動物公園咨詢了壹個教育問題,做了好評。
AKA咨詢了壹個教育問題,並給出了好評。
為妳推薦更多精彩內容——
如何投訴公安辦案人員?
視頻回答
王書敬律師
2022年3月29日回答
249喜歡2瀏覽
批發家具,上阿裏巴巴,廠家直供貨源!
1688廣告
西裝定制婚紗西裝商務西裝婚禮新郎禮服男士高級定制西裝韓版
1188元165438元
買
Simba.taobao.com廣告
李連傑想把國籍改成中國,被拒了三次。現在他想回歸本源。他會實現嗎?
李連傑大家都不陌生。他在國內外的聲望很高。他給我們帶來了很多經典的影視作品,他依靠
娛樂天才
2022年9月回答-14
156瀏覽
定制制服_查找定制制服產品、價格、工廠_去阿裏巴巴。
1688廣告
小產假15天工資怎麽算?
視頻回答
國尊律師事務所
2022年3月回答-31
247人喜歡3,860次瀏覽
黃軒帶著女朋友出現在機場。他的女朋友是誰?
視頻回答
舒緩又親切,小苗6902
2022-11-09回答
24個贊1條評論
不要錯過淘寶西服定制店附近上千萬的商品,品類齊全!
淘寶轉售廣告
港媒拍到郭富城和妻子方媛逛便利店。方媛靠什麽俘獲了國王的心?
我覺得她憑借個人的人品遠遠優於其他普通的網絡名人,尤其是在勤儉節約,聰明美德方面,這也是她能得到的原因。
生活小奶酪理論
2022年7月26日回答
544瀏覽
裝貨
全部
檢查輸入數據是否正常。有沒有異常數據(全是零,gt是錯的)
是否將數據正常化?
是否與預訓練模型的原始輸入標準壹致。
數據預處理是否正確?
把自己的問題簡單化。
檢查妳自己的損失函數。
檢查丟失的輸入。
檢查定制的網絡層
檢查凍結層的設置。
檢查維度信息是否匹配。
梯度返回檢查
檢查模型初始化參數。
超參數的設置是否合理。
簡化正則化
培訓模式與測試模式的相互轉換
可視化(權重、激活函數、權重直方圖、層更新)
使用不同的優化器
漸變爆炸和漸變消失(查看漸變值)
調整學習率(和權重要差壹個數量級,權重是0.1,學習率是0.001)。
NaN值(降低學習率,觀察是否有除以0/小的運算,檢查NaN出現的第壹個位置,調整激活函數)
參考