logo
Loading...

Day30 切分train test 及結果輸出的程式碼 - Cupoy

1. 切分train test 這段  這兩行的黃色部分的 train_X 代表相同的資料嗎    ...

將梯度提升樹結果輸出pred_gdbt,ml100-2,ml100-2-d30

Day30 切分train test 及結果輸出的程式碼

2019/05/18 00:16 上午
機器學習共學討論版
cathyy
觀看數:9
回答數:2
收藏數:0
將梯度提升樹結果輸出pred_gdbt
ml100-2
ml100-2-d30

1. 切分train test 這段  這兩行的黃色部分的 train_X 代表相同的資料嗎 

      又為何要採用 test 驗證而非 k-fold 交叉驗證呢?


train_X , test_X, train_Y, test_Y = train_test_split(train_X, train_Y, test_size=0.5)

train_X , val_X, train_Y, val_Y = train_test_split(train_X, train_Y, test_size=0.5)




2. 結果輸出 這段  為什麼逗號後面 黃色部分的底線是代表甚麼意思?


# 將梯度提升樹+葉編碼+邏輯斯迴歸結果輸出

pred_gdbt_lr = lr.predict_proba(onehot.transform(gdbt.apply(test_X)[:, :, 0]))[:, 1]

fpr_gdbt_lr, tpr_gdbt_lr, _ = roc_curve(test_Y, pred_gdbt_lr)

# 將梯度提升樹結果輸出

 pred_gdbt = gdbt.predict_proba(test_X)[:, 1]

fpr_gdbt, tpr_gdbt, _ = roc_curve(test_Y, pred_gdbt)