logo
Loading...

請問day7的範例程式中說因為salePrice偏度較大,使用np.log1p()將salePrice欄位值去除偏態,這個是要所有數值型欄位都要做,還是只針對label才要做。另外實務上sk值多大才要考慮做,你可以看我的圖上有另一個欄位比較大他後面要做np.log1p()嗎? - Cupoy

請問day7的範例程式中說因為salePrice偏度較大,使用np.log1p()將salePrice欄位值去除偏態,這個是要所有數值型欄位都要做,還是只針對label才要做。另外實務上sk值多大才要考慮做,你可以看我的圖上有另一個欄位比較大他後面要做np.log1p()嗎?

2022/01/26 上午 05:09
機器學習百日馬拉松
ang
觀看數:2
回答數:1
收藏數:0

![未命名.png](http://kwassistfile.cupoy.com/0000017E9302EF29000000046375706F795F72656C656173655155455354/1642407062937/large)

回答列表

  • 2022/01/26 下午 06:36
    Felix Pei
    贊同數:0
    不贊同數:0
    留言數:0

    同學您好, 一般不是所有的數值型欄位都要作,而是對一些偏度大的資料才需要,如果無差別的使用np.log1p()可能會把資料中的重要特徵屬性弱化,這樣就適得其反了。 至於要skew() 值要多大才適合? 這多半要看問題本身和開發者對該類問題的經驗,要試過比較過才知道。也期待其它AI老司機們出來指點一下。