資料前處理(資料清洗)與特徵工程實質差異
2020/06/30 上午 09:23
機器學習共學討論版
AmberC.
觀看數:9
回答數:1
收藏數:0
特徵值
特徵工程
資料前處理
資料清洗
您好:
想請問
資料前處理與特徵工程
目前所瞭解到的是
資料前處理是對原始資料進行資料清洗
而特徵工程是對特徵值進行處理
但二者都有離群值與缺失值的處理過程
故想請問
1.二者真正的差異?
2.能否舉例說明?
又想請問
在資料前處理階段
已經對資料進行一定的清洗
在特徵過程中
3.為何需要再一次重複的過程(離群值, 缺失值等處理)?
4.重複的過程處理二次是否會造成資料過度清洗等問題呢?
再麻煩各位大神解惑
謝謝
回答列表
-
2020/07/01 上午 00:50張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
嗨,晉慈
這只是名詞上的差異,並沒有很明顯的區隔。資料前處理通常是指進入模型前要進行的轉換,例如:資料清洗、特徵工程都是。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃