logo
Loading...

如何選擇最適合的 Scaler進行 Normalization - Cupoy

這幾天在進行Day_10, Day_11的練習將數值Normalization的方法,在學習過程中我...

Normalization

如何選擇最適合的 Scaler進行 Normalization

2020/06/02 上午 09:21
機器學習共學討論版
Jerry Huang
觀看數:69
回答數:1
收藏數:0
Normalization

這幾天在進行Day_10, Day_11的練習將數值Normalization的方法,在學習過程中我有一些疑問,如何選擇不同的Scaler進行Normalization,看到一篇文章做了一個實驗在回答這個問題


連結如下: https://towardsdatascience.com/normalization-vs-standardization-quantitative-analysis-a91e8a79cebf  


這篇文章作者以不同Scaling的方法,搭配不同的Classfier分析結果,最後又搭上PCA降維比較哪一種scaler可以拿到最高的分數,作者將這些組合代入數組不同的數據庫(Dataset)進行分析,發現同一組數據在不同組合下,有不同的效果,沒哪一種scaling方法,可以適用所有的Classfier,作者主張scaling method應該為超參數調整的項目之一。 

截圖如下:

節錄幾段文字如下:


"""Experiment with multiple scaling methods can dramatically increase your score on classification tasks, even when you hyperparameters are tuned. So, you should consider the scaling method as an important hyperparameter of your model."""


 """Scaling methods affect differently on different classifiers."""


我的問題是: 在實務上,在非超巨大資料量的處理上,這樣的組合分析似乎是最理想的方法,但實際上會這樣做嗎?還是以最常用的StandardScaler, MinMaxScaler即可滿足要求,達到一定的準確度後即等於完成任務,不需是最佳解法?


 謝謝各位寶貴的時間看完這個問題

回答列表

  • 2020/06/02 下午 09:18
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:2

    嗨,


    不同的資料適合不同的方法啊,而且也很難保證哪一種方法的效果一定比較好。通常實務上會建議,直接跑跑來實驗來比較。另外一個問題「還是以最常用的StandardScaler, MinMaxScaler即可滿足要求,達到一定的準確度後即等於完成任務,不需是最佳解法?」,具體上要看應用跟目的是什麼才能決定,追求準確度跟堪用即可都有。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃