logo
Loading...

Day29範例問題-重要性高低排序 - Cupoy

Day29中的範例中梯度提升樹擬合後, 將結果依照重要性由高到低排序,結果是OverallQual最...

ml100-2,ml100-2-d29

Day29範例問題-重要性高低排序

2019/05/19 上午 02:54
機器學習共學討論版
Battle0450
觀看數:4
回答數:2
收藏數:0
ml100-2
ml100-2-d29

Day29中的範例中梯度提升樹擬合後, 將結果依照重要性由高到低排序,結果是OverallQual最高再來是GrLivArea繼續排序下去,但往下到

觀察重要特徵與目標的分布的部分時,註解第一名變成GrLivArea然後才是OverallQual

請問這是什麼緣故?

回答列表

  • 2019/05/20 下午 03:53
    陳明佑 (Ming You Chen)
    贊同數:
    不贊同數:
    留言數:

    這很正常, 因為特徵重要性基於梯度提升樹的結果

    而梯度提升樹本身在 fit 時會有一些隨機性

    所以不要說同學自己跑

    老師在同一台機器上跑同一段程式碼, 結果都不見得一樣


    要排除也不是沒有方法, 就是在 fit 時加上 random_state

    包含模型與 train_test_split 等地方都要加, 才會一樣

    不過這也沒什麼必要就是了, 

    有時候A第一, 有時候B第一, 這樣不就能排除單次隨機結果的偏誤嗎?

  • 2019/05/21 上午 10:21
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    有時候A第一, 有時候B第一, 這樣不就能排除單次隨機結果的偏誤嗎?」有可能是這兩個欄位本來就都很重要,只是隨著模型的隨機性被凸顯。