logo
Loading...

降低偏態中的兩種方法np.log1p和stats.boxcox,使用哪種比較好? - Cupoy

范例中,使用np.log1p比较好~不过根据stats.boxcox的介绍,find the lam...

降低偏態中的兩種方法np.log1p和stats.boxcox,使用哪種比較好?

2019/09/24 上午 10:19
機器學習共學討論版
骑士
觀看數:7
回答數:1
收藏數:1

范例中,使用np.log1p比较好~

不过根据stats.boxcox的介绍,find the lambda that maximizes the log-likelihood function,这里的意思是找到的lambda可以让转换后的资料分布最像正态分布吗?所以使用stats.boxcox会比较好?

回答列表

  • 2019/09/26 下午 05:20
    陳明佑 (Ming You Chen)
    贊同數:0
    不贊同數:0
    留言數:1

    boxcox  的好處是有參數可以調整,  

    在仔細調參的情況下, 有可能比 log1p 更好


    但是 log1p 的好處就在於它沒有參數

    而且統計次數或頻率類型的特徵, 

    0會是他的最小值, 且大多數值都靠近0 (相對於最大值)

    使用 log1p 會更為簡捷, 可以說 log1p的去偏是針對計數特徵設計的


    簡單的說, 如果是計數類型的特徵, 不妨直接使用 log1p

    但如果不是, 則建議使用 boxcox 調參, 參數介於 0 到 0.5 之間