缺失值的處理
2019/10/03 11:04 上午
機器學習共學討論版
doris
觀看數:28
回答數:6
收藏數:0
d16
嗨,由於BaseLine是後續做機器學習的比較基礎,所以我的想法是讓BaseLin-e的處理方式越直接越好,不要過多的調整。所以處理缺值的方式,希望是將train 所有有缺值的資料(row)刪除(保留真實的資料,不預測或是調整缺值)。但會發現一個問題,由於比賽要求,test的筆數沒辦法刪除,每一筆必須被保留下來,所以test的缺值必須要被補值,那在這種情況下,
(1) 是不是就一定要處理train的缺值?
(2) 且針對train和test同一個欄位的處理方式是否應該要一致?