logo
Loading...

如何判斷好的編碼方式? - Cupoy

label encoder算出的分數是0.78, 用mean encoder(剔除Name&Tick...

ml100-2,ml100-2-d23

如何判斷好的編碼方式?

2019/05/19 04:29 下午
機器學習共學討論版
辛普恩
觀看數:21
回答數:2
收藏數:0
ml100-2
ml100-2-d23

label encoder算出的分數是0.78, 用mean encoder(剔除Name&Ticket欄位後)的分數是0.83。怎麼判斷這是找到真的好的編碼方式,而不是因為overfitting造成分數的增加?另外,判斷欄位種類過多的criteria是?