Day30 切分train test 及結果輸出的程式碼
2019/05/18 00:16 上午
機器學習共學討論版
cathyy
觀看數:10
回答數:2
收藏數:0
將梯度提升樹結果輸出pred_gdbt
ml100-2
ml100-2-d30
1. 切分train test 這段 這兩行的黃色部分的 train_X 代表相同的資料嗎
又為何要採用 test 驗證而非 k-fold 交叉驗證呢?
train_X , test_X, train_Y, test_Y = train_test_split(train_X, train_Y, test_size=0.5)
train_X , val_X, train_Y, val_Y = train_test_split(train_X, train_Y, test_size=0.5)
2. 結果輸出 這段 為什麼逗號後面 黃色部分的底線是代表甚麼意思?
# 將梯度提升樹+葉編碼+邏輯斯迴歸結果輸出
pred_gdbt_lr = lr.predict_proba(onehot.transform(gdbt.apply(test_X)[:, :, 0]))[:, 1]
fpr_gdbt_lr, tpr_gdbt_lr, _ = roc_curve(test_Y, pred_gdbt_lr)
# 將梯度提升樹結果輸出
pred_gdbt = gdbt.predict_proba(test_X)[:, 1]
fpr_gdbt, tpr_gdbt, _ = roc_curve(test_Y, pred_gdbt)