Blending 的權重?
2019/10/21 下午 00:01
機器學習共學討論版
駱志忠
觀看數:39
回答數:2
收藏數:0
ml100-3
ml100-3-d49
d49 部份範例及 3個csv檔上傳結果如下,但還是不瞭解權重是怎麼計算出來的?
# 混合泛化預測檔 (依 Kaggle 傳回分數調整比重, 越準確者比重越高, 依資料性質有所不同)
blending_pred = linear_pred*0.30 + gdbt_pred*0.67 + rf_pred*0.03
回答列表
-
2019/10/21 下午 09:59張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
你是說 0.30 、0.67 、0.03 這三個數字怎麼出來的嗎?
-
2019/10/22 下午 03:26陳明佑 (Ming You Chen)贊同數:1不贊同數:0留言數:1
同學您好 :
其實競賽中往往是有 LeadBoard 的,
因此可以按照 submit 的結果調整權重大小 (越準確者權重越大)
如果是沒有 Leadboard 的賽事/專題, 則是以 cross validation 的結果考量權重大小
至於調整比重沒有固定做法, 而是先按經驗調整 (但要注意總和為1)
然後將綜合的結果 submit 看看 blending 的效果如何
多調幾種, 測試何者效果較好,
也是依照資料而定, 並沒有一定的法則