logo
Loading...

【QA】模型訓練前,為什麼要對數值作特徵正規化? - Cupoy

得到有效特徵是執行特徵工程很重要的目的,有了好的特徵就能幫助我們訓練出好的模型。在特徵工程中有個「特...

【QA】模型訓練前,為什麼要對數值作特徵正規化?

2022/05/31 下午 01:34
機器學習共學討論版
王健安
觀看數:183
回答數:1
收藏數:0

得到有效特徵是執行特徵工程很重要的目的,有了好的特徵就能幫助我們訓練出好的模型。在特徵工程中有個「特徵正規化」的步驟,對我們來說相當重要,那為什麼我們需要對數值做特徵正規化呢?

回答列表

  • 2022/05/31 下午 01:35
    王健安
    贊同數:0
    不贊同數:0
    留言數:0

    ## 什麼是特徵正規化 - 將不同範圍的特徵轉換成同一個範圍的特徵 - 例如:將數值轉換成 [0, 1] 的範圍內 ## 特徵正規化有哪些方法 - Standardization(Z-Score Normalization) - 將資料統一轉換成平均數為 0、標準差為 1 的資料 - $X_{Standardization}=\frac{X-\mu}{\sigma}$ - Normalization(Min-Max Scaler) - 將資料統計轉換成 [0, 1] 的資料 - $X_{Normalization}=\frac{X-X_{min}}{X_{max}-X_{min}}$ ![](https://i.imgur.com/YrrJBCZ.png) ## 若不做特徵正規化,將會對模型造成什麼影響?做了正規化又有什麼好處? - 先備知識:「電腦」沒有單位的概念,只知道數字大小 - 反面案例:假設有兩個特徵,一個特徵是年齡,另一個特徵是每月薪資。有某筆資料的年齡、每月薪資都是 100 元,請問以「人」角度跟以「電腦」角度思考面向有相同嗎? - 透過正規化,不僅讓每個特徵的範圍具體被定義,每個特徵的單位也都被轉換一致。 ## 有哪些模型就算沒有特徵正規化,也不會對模型造成影響 - Tree-based Model - Decision Tree - Random Forest - eXtreme Gradient Boosting (XGBoost) - Light Gradient Boosting Machine (LightGBM) ## Reference TOWARD AI 2020. *Machine Learning Standardization (Z-Score Normalization) with Mathematics.* Jaitley U. 2018. *Wht Data Normalization is necessary for Machine Learning Models.*