logo
Loading...

scaler.fit_transform程式問題 - Cupoy

1.train_X = scaler.fit_transform(df_temp)想問為何在這邊做這...

scaler.fit_transform程式問題

2020/03/28 下午 01:53
機器學習共學討論版
江柏勳
觀看數:9
回答數:3
收藏數:0

1.train_X = scaler.fit_transform(df_temp)

想問為何在這邊做這行的意義,而且這樣train_Y沒有轉換會影響到結果嗎?

2.關於講義的週期循環特徵,想請問一下怎麼定的(我知道這2個函數都有週期性,但選取的

變數卻不同)

回答列表

  • 2020/03/28 下午 03:46
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:1

    嗨,柏勳


    「1.train_X = scaler.fit_transform(df_temp)

    想問為何在這邊做這行的意義,而且這樣train_Y沒有轉換會影響到結果嗎?」


    想先跟你確認一閜你知道 scaler.fit_transform 這個操作(正規化)在做什麼嗎?


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/03/29 下午 08:23
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:1

    「我記得這邊是在做最大最小化,然後後面.fit_transform這個好像是執行的方法(可能講得有點淺白)


    => 那為什麼要做最大最小化呢?主要原因是要保持所有特徵的範圍差不多,不要被某一個特徵所影響。因此這個操作是只需要對特徵進行的。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/03/30 上午 00:12
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:1

    可以稍微解釋的淺白一點嗎?(直接去做cross_val_score有什麼不好嗎?)


    => 所以這邊的問題是為什麼要做「最大最小化」嗎?你可以想像如果你有兩個欄位,一個欄位的數值是 1-10,另一個欄位的數值是 1-10000000,同時拿這兩個欄位對 Y 做預測,兩個欄位對於數值變化的敏感性是有差的。對第一個欄位來說,1, 2 就差了很多,但對第二個欄位來說,1, 2 之間的差距是很小的。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃