Loading...

Day29範例問題-重要性高低排序 - Cupoy

Day29中的範例中梯度提升樹擬合後, 將結果依照重要性由高到低排序，結果是OverallQual最...

ml100-2,ml100-2-d29

AI共學社群

Day29範例問題-重要性高低排序

2019/05/19 上午 02:54

機器學習共學討論版

Battle0450

觀看數：4

回答數：2

收藏數：0

ml100-2

ml100-2-d29

Day29中的範例中梯度提升樹擬合後, 將結果依照重要性由高到低排序，結果是OverallQual最高再來是GrLivArea繼續排序下去，但往下到

觀察重要特徵與目標的分布的部分時，註解第一名變成GrLivArea然後才是OverallQual

請問這是什麼緣故?

回答列表

2019/05/20 下午 03:53

陳明佑 (Ming You Chen)

贊同數：

不贊同數：

留言數：

這很正常, 因為特徵重要性基於梯度提升樹的結果

而梯度提升樹本身在 fit 時會有一些隨機性

所以不要說同學自己跑

老師在同一台機器上跑同一段程式碼, 結果都不見得一樣

要排除也不是沒有方法, 就是在 fit 時加上 random_state

包含模型與 train_test_split 等地方都要加, 才會一樣

不過這也沒什麼必要就是了,

有時候A第一, 有時候B第一, 這樣不就能排除單次隨機結果的偏誤嗎?
2019/05/21 上午 10:21

張維元 (WeiYuan)

贊同數：1

不贊同數：0

留言數：0

「有時候A第一, 有時候B第一, 這樣不就能排除單次隨機結果的偏誤嗎?」有可能是這兩個欄位本來就都很重要，只是隨著模型的隨機性被凸顯。