logo
Loading...

資料前處理(資料清洗)與特徵工程實質差異 - Cupoy

您好:想請問資料前處理與特徵工程目前所瞭解到的是資料前處理是對原始資料進行資料清洗而特徵工程是對特徵...

特徵值,特徵工程,資料前處理,資料清洗

資料前處理(資料清洗)與特徵工程實質差異

2020/06/30 上午 09:23
機器學習共學討論版
AmberC.
觀看數:9
回答數:1
收藏數:0
特徵值
特徵工程
資料前處理
資料清洗

您好:

想請問

資料前處理與特徵工程

目前所瞭解到的是

資料前處理是對原始資料進行資料清洗

而特徵工程是對特徵值進行處理

但二者都有離群值與缺失值的處理過程


故想請問

1.二者真正的差異?

2.能否舉例說明?

又想請問

在資料前處理階段

已經對資料進行一定的清洗

在特徵過程中

3.為何需要再一次重複的過程(離群值, 缺失值等處理)?

4.重複的過程處理二次是否會造成資料過度清洗等問題呢?


再麻煩各位大神解惑

謝謝

回答列表

  • 2020/07/01 上午 00:50
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    嗨,晉慈


    這只是名詞上的差異,並沒有很明顯的區隔。資料前處理通常是指進入模型前要進行的轉換,例如:資料清洗、特徵工程都是。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃