訓練資料及測試資料的問題 - Cupoy

1 .請問 Day_016 中原本的 app_train 和 app_test 兩個 datafra...

ml100-2,train,validation set,ml100-2-d16

2019/05/01 下午 06:50

機器學習共學討論版

cathyy

觀看數：6

回答數：3

收藏數：0

ml100-2

train

validation set

ml100-2-d16

1 .請問 Day_016 中原本的 app_train 和 app_test 兩個 dataframe 為什麼要另外複製成 train test 來操作

而且我跑了 train 跟 test 都是 array形式在跑模型時會有差別嗎

# 特徵欄位清單

train = app_train

features = list(train.columns)

#複製 test 資料

test = app_test.copy()

2 .另外 features 並沒有用到為甚麼還要特別列這一行 ??

3. 以下程式碼是將變數標準化那 SK_ID_CURR好像還沒有去掉?! 是不是也拿去做標準化了??

#縮放器載入 train 的上下限, 對 train, test 進行縮放轉換

train = scaler.transform(train)

test = scaler.transform(test)

4. 最後這段是把每個人的機率併再一起

但要怎麼確定每一筆跑出來是1的機率(log_reg_pred) 剛好對的到每一筆SK_ID_CURR ??

是因為順序一樣所以直接併一起就能知道每個人遲繳貸款的機率???

submit = app_test[['SK_ID_CURR']]

submit['TARGET'] = log_reg_pred

submit.head()