特徵工程前的code資料處理方式?
2019/05/10 02:45 下午
機器學習共學討論版
Ethan Wu
觀看數:5
回答數:1
收藏數:0
ml100-2
請問先進 這邊的CODE為何是這樣處理呢?根據註解與比對CODE還是不太了解,謝謝!
# 訓練資料需要 train_X, train_Y / 預測輸出需要 ids(識別每個預測值), test_X
# 在此先抽離出 train_Y 與 ids, 而先將 train_X, test_X 該有的資料合併成 df, 先作特徵工程
train_Y = np.log1p(df_train['SalePrice'])
ids = df_test['Id']
df_train = df_train.drop(['Id', 'SalePrice'] , axis=1)
df_test = df_test.drop(['Id'] , axis=1)