Overfitting的解釋
2019/06/13 下午 00:49
機器學習共學討論版
Wei Yee Lim
觀看數:21
回答數:2
收藏數:0
ml100-2
ml100-2-d33
老師們好,這這天的內容中,有提到overfitting:
當中有提到說overfitting表示可能學習到資料中的噪音,這一點我不是很明白,
難道不是單純因為模型過於複雜,或是資料過少導致?
回答列表
-
2019/06/13 下午 03:36Jimmy贊同數:0不贊同數:0留言數:1
Hi Wei Yee Lim!
現實中的資料有各種可能的錯誤,人工標註錯誤、格式錯誤或者是資料搜集的偏誤 (例如要做貓狗分類器,結果狗的照片剛好都是晴天,貓的照片都是雨天)。
諸如此類的錯誤都可以視為資料中的噪音,也就是這些噪音對我們最終要預測的目標沒有任何幫助,當你的模型過於複雜時,模型就有能力捕捉這些噪音,導致實際在應用時失準囉!
-
2019/06/18 下午 03:48張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
不一定「單純因為模型過於複雜,或是資料過少導致」,因為相同的資料,每次抽樣都有可能不同,如果模型太 fit 某一種資料,就可能造成 overfitting 的現象。