logo
Loading...

缺失值的處理 - Cupoy

嗨,由於BaseLine是後續做機器學習的比較基礎,所以我的想法是讓BaseLin-e的處理方式越直...

d16

缺失值的處理

2019/10/03 11:04 上午
機器學習共學討論版
doris
觀看數:28
回答數:6
收藏數:0
d16

嗨,由於BaseLine是後續做機器學習的比較基礎,所以我的想法是讓BaseLin-e的處理方式越直接越好,不要過多的調整。所以處理缺值的方式,希望是將train 所有有缺值的資料(row)刪除(保留真實的資料,不預測或是調整缺值)。但會發現一個問題,由於比賽要求,test的筆數沒辦法刪除,每一筆必須被保留下來,所以test的缺值必須要被補值,那在這種情況下,

 

(1) 是不是就一定要處理train的缺值?

(2) 且針對train和test同一個欄位的處理方式是否應該要一致?