【QA】學習率(Learning rate)高低對梯度下降的影響 ? - Cupoy

學習率是一個常見的超參數，也就是說需要我們人工進行調整的，大家可以根據經驗法則，或是前人的智慧，作...

【QA】學習率(Learning rate)高低對梯度下降的影響 ?

2021/08/25 上午 11:35

機器學習共學討論版

Chili

觀看數：34

回答數：1

收藏數：0

學習率是一個常見的超參數，也就是說需要我們人工進行調整的，大家可以根據經驗法則，或是前人的智慧，作為一開始的預設值，並依據模型的表現在進行挑整。那究竟學習率的高低，個別在模型表現上，會有怎麼樣的影響呢？我想在下面跟大家討論一下。

回答列表

2021/08/25 上午 11:36

Chili

贊同數：0

不贊同數：0

留言數：0

![image](http://kwassistfile.cupoy.com/0000017B7B60D307000000196375706F795F72656C65617365414E53/1629431130920/large) 從公式中我們可以得知，學習率大小可以直接影響到模型速度到收斂到局部最優解的速度，學習率越大，神經網路的學習速度越快。但學習率太大或是太小，都會產生問題。 --- ![image](http://kwassistfile.cupoy.com/0000017B7B60D307000000196375706F795F72656C65617365414E53/1629431130921/large) * 學習率過小：如果學習率過小，神經網路不只收斂的速度會非常慢，並且有可能會陷入局部最優解的僵局，走不出來。 * 學習率過大：當學習率過大時，收斂幅度太大，超過極值，Loss就會停止下降，並在同一個Loss值反覆震盪，達不到最小值的位置。 --- 我們可以把學習率想像成，一螞蟻走路時的步伐。假如有一個甜食放置於一碗中，需要走到最下面才能吃到，而當學習率太小時，螞蟻走的步伐過小，到達碗底的速度會變得非常久，這是我們不樂意見到的。反觀螞蟻步伐過大時，就好像擁有超長的腳，每跨一步就會到達碗的另一側，永遠達不到最底點的狀態。 ![image](http://kwassistfile.cupoy.com/0000017B7B60D307000000196375706F795F72656C65617365414E53/1629431130922/large) --- * 參考資料 https://www.youtube.com/watch?v=9sJG7LjGCnI&list=PLXO45tsB95cJ0U2DKySDmhRqQI9IaGxck&index=5