練習特徵處理時所用的MinMaxScaler函式的使用時機
2020/05/31 10:37 下午
機器學習共學討論版
Jerry Huang
觀看數:31
回答數:3
收藏數:0
老師您好:
目前練習Day_10 特徵處理時,有用到MinMaxScaler函式整理數據,查了一些資料,會用到此函式的時機有兩種,一種是標準差(SD)較小時,一種想讓稀疏數據中的0值繼續為0,增加數據穩定性,我有使用另一個skilearn函式StandardScaler做比較,兩個函式都會讓數值盡量介於0, 1之間,發現兩種標準化後執行Day_10作業時,結果都差不多,以下是我的問題:
1. MinMaxScaler使用時機為何?所謂標準差較小時,是多小?有量化標準嗎?
2. 使稀疏數據中的0值繼續為0,增加數據穩定性,這句話不能理解,不是本來就是零,零乘零還是零,但大的數值卻是變小了,還請老師解惑?
3. MinMaxScaler 和 StandardScaler 兩者可有優缺點可比較?或是使用時機不同?
謝謝老師的寶貴時間解答