請問day7的範例程式中說因為salePrice偏度較大,使用np.log1p()將salePrice欄位值去除偏態,這個是要所有數值型欄位都要做,還是只針對label才要做。另外實務上sk值多大才要考慮做,你可以看我的圖上有另一個欄位比較大他後面要做np.log1p()嗎?
2022/01/26 上午 05:09
機器學習百日馬拉松
ang
觀看數:2
回答數:1
收藏數:0
![未命名.png](http://kwassistfile.cupoy.com/0000017E9302EF29000000046375706F795F72656C656173655155455354/1642407062937/large)
回答列表
-
2022/01/26 下午 06:36Felix Pei贊同數:0不贊同數:0留言數:0
同學您好, 一般不是所有的數值型欄位都要作,而是對一些偏度大的資料才需要,如果無差別的使用np.log1p()可能會把資料中的重要特徵屬性弱化,這樣就適得其反了。 至於要skew() 值要多大才適合? 這多半要看問題本身和開發者對該類問題的經驗,要試過比較過才知道。也期待其它AI老司機們出來指點一下。