降低偏態中的兩種方法np.log1p和stats.boxcox,使用哪種比較好?
2019/09/24 上午 10:19
機器學習共學討論版
骑士
觀看數:7
回答數:1
收藏數:1
范例中,使用np.log1p比较好~
不过根据stats.boxcox的介绍,find the lambda that maximizes the log-likelihood function,这里的意思是找到的lambda可以让转换后的资料分布最像正态分布吗?所以使用stats.boxcox会比较好?
回答列表
-
2019/09/26 下午 05:20陳明佑 (Ming You Chen)贊同數:0不贊同數:0留言數:1
boxcox 的好處是有參數可以調整,
在仔細調參的情況下, 有可能比 log1p 更好
但是 log1p 的好處就在於它沒有參數
而且統計次數或頻率類型的特徵,
0會是他的最小值, 且大多數值都靠近0 (相對於最大值)
使用 log1p 會更為簡捷, 可以說 log1p的去偏是針對計數特徵設計的
簡單的說, 如果是計數類型的特徵, 不妨直接使用 log1p
但如果不是, 則建議使用 boxcox 調參, 參數介於 0 到 0.5 之間