何時切分 test set?是在資料處理前還是處理後?
2020/10/25 下午 03:31
訓練/測試集切分的概念
Will
觀看數:19
回答數:2
收藏數:1
以前有提到 test set 應該要切割開來,維持 blind & untouched 。但如果在資料處理時,把一些outliers 除掉,或是進行 transformation 和添加新features,是等這些步驟做完才切分 train / validation/ test嗎?還是說要在一開始 import dataset 的時候,就先進行切分?謝謝
回答列表
-
2020/10/25 下午 04:41張維元 (WeiYuan)贊同數:2不贊同數:0留言數:0
-
2020/10/26 上午 00:14Jeffrey贊同數:0不贊同數:0留言數:0
建議是:
1. 把一些outliers 除掉, 就可以切出 test dataset.
2. 進行 transformation 和添加新features,是等這些步驟做完才切分 train / validation