數據前處理或標準化是要在切割前還是切割後進行?
2021/06/09 上午 09:13
訓練/測試集切分的概念
Yaoga
觀看數:128
回答數:1
收藏數:0
如題,想請問若是要將特徵進行標準化或是對目標取對數避免拖尾離群值等等, 這些是拿到資料後先行處理? 還是說採用: (1)選定訓練集的處理方式來對驗證測試集處理? (2)拿出測試集後,未劃分訓練驗證集前先行處理? 感謝各位前輩的指教!
回答列表
-
2021/06/09 上午 10:30Jaio贊同數:1不贊同數:0留言數:6
先做數據前處理,再對處理完的資料做切分,因為當你拿到該筆資料時,可能有些地方有遺失值等等,若先切完,那麼要針對兩分資料做一樣的動作較沒效率。