HW 023 # 均值編碼寫法可以解釋一下嗎, 看起來很繞?
2019/05/09 下午 10:10
機器學習共學討論版
陳秉涵
觀看數:11
回答數:1
收藏數:2
均值編碼data
ml100-2
ml100-2-d23
# 均值編碼
data = pd.concat([df[:train_num], train_Y], axis=1)
for c in df.columns:
mean_df = data.groupby([c])['SalePrice'].mean().reset_index()
mean_df.columns = [c, f'{c}_mean']
data = pd.merge(data, mean_df, on=c, how='left')
data = data.drop([c] , axis=1)
data = data.drop(['SalePrice'] , axis=1)
回答列表
-
2019/05/13 上午 02:20張維元 (WeiYuan)贊同數:3不贊同數:0留言數:0
1. for-loop 對每個欄位進行迴圈
2. 對每個欄位計算均值編碼
3. 把計算的結果合併回 DataFrame
4. 把原本的欄位從 DataFrame Drop 掉