boxcox 寫法問題
2019/09/22 下午 10:05
機器學習共學討論版
陳美心
觀看數:96
回答數:2
收藏數:0
ml100-3
ml100-3-d23
在Day_023_Reduce_Skewness中,使用的程式碼是
f_fixed['LotArea'] = stats.boxcox(df['LotArea'], lmbda=0.5)
這邊我理解boxcox的參數是0.5,對應的就是sqrt
但,在Day_023_HW中,使用的程式碼是
df_fixed['Fare'] = stats.boxcox(df_fixed['Fare'])[0]
想請問:對應的lmbda是多少?為何最後需要指定[0]?
謝謝。
回答列表
-
2019/09/22 下午 11:51張維元 (WeiYuan)贊同數:0不贊同數:0留言數:1
1. 對應的lmbda是多少?
=> 根據文中,預設會有自動產生:If lmbda is None, find the lambda that maximizes the log-likelihood function and return it as the second output argument.
2. 回傳的值會多個數值,第零個才是真正的 boxcox。
-
2019/09/23 下午 05:10張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
「請問在未指定lmbda時,lmbda 的值如何計算出來的?」
=> find the lambda that maximizes the log-likelihood function,意思應該是說會利用 log-likelihood 去計算 lambda 多少時可以得到最大的 y 就用這個值?