logo
Loading...

訓練資料及測試資料的問題 - Cupoy

1 .請問 Day_016 中原本的 app_train 和 app_test 兩個 datafra...

ml100-2,train,validation set,ml100-2-d16

訓練資料及測試資料的問題

2019/05/01 06:50 下午
機器學習共學討論版
cathyy
觀看數:5
回答數:3
收藏數:0
ml100-2
train
validation set
ml100-2-d16

1 .請問 Day_016 中原本的 app_train 和 app_test 兩個 dataframe  為什麼要另外複製成 train  test 來操作

而且我跑了  train 跟 test   都是 array形式  在跑模型時會有差別嗎 


# 特徵欄位清單

train = app_train

features = list(train.columns)


#複製 test 資料

test = app_test.copy()


2 .另外 features 並沒有用到 為甚麼還要特別列這一行 ??


3. 以下程式碼是將變數標準化 那 SK_ID_CURR好像還沒有去掉?! 是不是也拿去做標準化了?? 


#縮放器載入 train 的上下限, 對 train, test 進行縮放轉換 

scaler.fit(train) 

train = scaler.transform(train) 

test = scaler.transform(test)


4. 最後這段 是把每個人的機率併再一起 

但要怎麼確定  每一筆跑出來是1的機率(log_reg_pred) 剛好對的到 每一筆SK_ID_CURR ?? 

是因為順序一樣 所以直接併一起 就能知道每個人遲繳貸款的機率??? 


submit = app_test[['SK_ID_CURR']]

submit['TARGET'] = log_reg_pred

submit.head()