logo
Loading...

如何選擇最適合的 Scaler進行 Normalization - Cupoy

這幾天在進行Day_10, Day_11的練習將數值Normalization的方法,在學習過程中我...

Normalization

如何選擇最適合的 Scaler進行 Normalization

2020/06/02 09:21 上午
機器學習共學討論版
Jerry Huang
觀看數:22
回答數:1
收藏數:0
Normalization

這幾天在進行Day_10, Day_11的練習將數值Normalization的方法,在學習過程中我有一些疑問,如何選擇不同的Scaler進行Normalization,看到一篇文章做了一個實驗在回答這個問題


連結如下: https://towardsdatascience.com/normalization-vs-standardization-quantitative-analysis-a91e8a79cebf  


這篇文章作者以不同Scaling的方法,搭配不同的Classfier分析結果,最後又搭上PCA降維比較哪一種scaler可以拿到最高的分數,作者將這些組合代入數組不同的數據庫(Dataset)進行分析,發現同一組數據在不同組合下,有不同的效果,沒哪一種scaling方法,可以適用所有的Classfier,作者主張scaling method應該為超參數調整的項目之一。 

截圖如下:

節錄幾段文字如下:


"""Experiment with multiple scaling methods can dramatically increase your score on classification tasks, even when you hyperparameters are tuned. So, you should consider the scaling method as an important hyperparameter of your model."""


 """Scaling methods affect differently on different classifiers."""


我的問題是: 在實務上,在非超巨大資料量的處理上,這樣的組合分析似乎是最理想的方法,但實際上會這樣做嗎?還是以最常用的StandardScaler, MinMaxScaler即可滿足要求,達到一定的準確度後即等於完成任務,不需是最佳解法?


 謝謝各位寶貴的時間看完這個問題