請問Day 28中提到的共線性是什麼意思呢?
2019/05/19 上午 00:12
機器學習共學討論版
仁傑潘
觀看數:33
回答數:1
收藏數:0
ml100-2
ml100-2-d28
請問Day 28中提到的共線性是什麼意思呢?
google出來的結果都太艱澀看不太懂
是否有大大有白話文版本的呢?
回答列表
-
2019/05/20 下午 03:33陳明佑 (Ming You Chen)贊同數:5不贊同數:0留言數:0
舉個例子來說 : 體重常聽到有兩種度量衡 - 公斤與英鎊
我們要用模型衡量一個人的健康程度, 很明顯體重會是一個重要特徵
但是如果同時有"公斤"與"英鎊"兩種特徵時
因為兩者間存在線性關係 (轉換只差一個倍數),
只用相關係數這類方式篩選, 兩個特徵都會通過篩選
這時候篩選通過的特徵拿來做線性回歸時,
體重重要性就會增加到兩倍(因為特徵中占據兩個名額)
這樣模型估計就會有偏誤
(體重很重要, 但只該留下一個就好)
共線性大致講的是上述這種情況,
但是即使不是完全線性, 而是相關度很高, 也會影響很大
不知道這樣的回答, 同學是否覺得夠白話呢XD