Day29範例問題-重要性高低排序
2019/05/19 上午 02:54
機器學習共學討論版
Battle0450
觀看數:4
回答數:2
收藏數:0
ml100-2
ml100-2-d29
Day29中的範例中梯度提升樹擬合後, 將結果依照重要性由高到低排序,結果是OverallQual最高再來是GrLivArea繼續排序下去,但往下到
觀察重要特徵與目標的分布的部分時,註解第一名變成GrLivArea然後才是OverallQual
請問這是什麼緣故?
回答列表
-
2019/05/20 下午 03:53陳明佑 (Ming You Chen)贊同數:不贊同數:留言數:
這很正常, 因為特徵重要性基於梯度提升樹的結果
而梯度提升樹本身在 fit 時會有一些隨機性
所以不要說同學自己跑
老師在同一台機器上跑同一段程式碼, 結果都不見得一樣
要排除也不是沒有方法, 就是在 fit 時加上 random_state
包含模型與 train_test_split 等地方都要加, 才會一樣
不過這也沒什麼必要就是了,
有時候A第一, 有時候B第一, 這樣不就能排除單次隨機結果的偏誤嗎?
-
2019/05/21 上午 10:21張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
「有時候A第一, 有時候B第一, 這樣不就能排除單次隨機結果的偏誤嗎?」有可能是這兩個欄位本來就都很重要,只是隨著模型的隨機性被凸顯。