logo
Loading...

資料前處理階段與特徵工程階段重複的問題 - Cupoy

想請問在前處理階段填補缺值、去離群值和特徵縮放與特徵工程階段填補缺值、去離群值和特徵縮放的差異在哪?...

探索式

資料前處理階段與特徵工程階段重複的問題

2019/09/27 下午 01:06
機器學習共學討論版
doris
觀看數:10
回答數:1
收藏數:0
探索式

想請問在前處理階段填補缺值、去離群值和特徵縮放

特徵工程階段填補缺值、去離群值和特徵縮放的差異在哪?


我目前的理解是前處理階段的填補缺值、去離群值和特徵縮放的處理,是作為後續EDA使用。若進入特徵工程階段的填補缺值、去離群值和特徵縮放處理,則是用來優化模型,所以在這個階段的填補缺值、去離群值或特徵縮放的方式可能會不斷修改,不知道這樣的理解是否有誤?

回答列表

  • 2019/09/27 下午 03:02
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    沒差。應該這樣說,「前處理階段」或「特徵工程階段」本來就是來來回回的,沒有很嚴謹的規範。只能說他們的目的可能有些微差異(如果你下一段講的),前處理是讓資料可以分析,特徵工程分得更好