logo
Loading...

葉編碼的效果與訓練的資料量 - Cupoy

最近嘗試XGBoost + 葉編碼, 發現加了葉編碼後表現退步了。回過頭來思考原因,想請問老師的是 ...

ml100-3,ml100-3-d32

葉編碼的效果與訓練的資料量

2019/10/28 下午 01:21
機器學習共學討論版
Kevin Tan
觀看數:36
回答數:2
收藏數:0
ml100-3
ml100-3-d32

最近嘗試XGBoost + 葉編碼, 發現加了葉編碼後表現退步了。回過頭來思考原因,想請問老師的是 : 

原本是100%的資料餵給 XGBoost去train, 現在只剩50% (以"Day_032_Leaf_Encoding.ipynb"為例) 餵給 XGBoost去train,出來的中間結果應該會比100%差。然後這個中間結果,儘管再配合另外50%的資料去train, 但是所用的模型假如不比XGBoost好,那overall的結果應該會退步吧 ?

回答列表

  • 2019/10/29 下午 05:59
    Jeffrey
    贊同數:0
    不贊同數:0
    留言數:2

    同學,你的意思是把data 分成兩部份分別做training, 所以參數都相同?另外test set 或是 cross validation 也是直切一半50%?

  • 2019/10/29 下午 11:08
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:3

    我比較好奇的是,XGBoost + 葉編碼 是怎麼操作的?可以補充多一點資訊嗎?