logo
Loading...

Blending 的權重? - Cupoy

d49 部份範例及 3個csv檔上傳結果如下,但還是不瞭解權重是怎麼計算出來的?# 混合泛化預測檔 ...

ml100-3,ml100-3-d49

Blending 的權重?

2019/10/21 下午 00:01
機器學習共學討論版
駱志忠
觀看數:39
回答數:2
收藏數:0
ml100-3
ml100-3-d49

d49 部份範例及 3個csv檔上傳結果如下,但還是不瞭解權重是怎麼計算出來的?


# 混合泛化預測檔 (依 Kaggle 傳回分數調整比重, 越準確者比重越高, 依資料性質有所不同)

blending_pred = linear_pred*0.30 + gdbt_pred*0.67 + rf_pred*0.03


回答列表

  • 2019/10/21 下午 09:59
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    你是說 0.30 、0.67 、0.03 這三個數字怎麼出來的嗎?

  • 2019/10/22 下午 03:26
    陳明佑 (Ming You Chen)
    贊同數:1
    不贊同數:0
    留言數:1

    同學您好 :


    其實競賽中往往是有 LeadBoard 的, 

    因此可以按照 submit 的結果調整權重大小 (越準確者權重越大)

    如果是沒有 Leadboard 的賽事/專題, 則是以 cross validation 的結果考量權重大小


    至於調整比重沒有固定做法, 而是先按經驗調整 (但要注意總和為1)

    然後將綜合的結果 submit 看看 blending 的效果如何

    多調幾種, 測試何者效果較好, 

    也是依照資料而定, 並沒有一定的法則