logo
Loading...

HW 023 # 均值編碼寫法可以解釋一下嗎, 看起來很繞? - Cupoy

# 均值編碼data = pd.concat([df[:train_num], train_Y], ...

均值編碼data,ml100-2,ml100-2-d23

HW 023 # 均值編碼寫法可以解釋一下嗎, 看起來很繞?

2019/05/09 下午 10:10
機器學習共學討論版
陳秉涵
觀看數:11
回答數:1
收藏數:2
均值編碼data
ml100-2
ml100-2-d23

# 均值編碼

data = pd.concat([df[:train_num], train_Y], axis=1)

for c in df.columns:    

    mean_df = data.groupby([c])['SalePrice'].mean().reset_index()    

    mean_df.columns = [c, f'{c}_mean']    

    data = pd.merge(data, mean_df, on=c, how='left')

    data = data.drop([c] , axis=1)

    data = data.drop(['SalePrice'] , axis=1)

回答列表

  • 2019/05/13 上午 02:20
    張維元 (WeiYuan)
    贊同數:3
    不贊同數:0
    留言數:0

    1. for-loop 對每個欄位進行迴圈

    2. 對每個欄位計算均值編碼

    3. 把計算的結果合併回 DataFrame

    4. 把原本的欄位從 DataFrame Drop 掉