cross_val_score使用方式
2019/06/24 下午 01:53
機器學習共學討論版
邱秉誠
觀看數:25
回答數:1
收藏數:0
ml100-2-d48
ml100-2
嗨,
想請問最初的train資料集,特徵是X,label是y
在建立模型時通常會以train_test_split拆開成X_train, X_test, y_train, y_test
評估模型,是要以
1. cross_val_score(model,X_train,y_train)
2. cross_val_score(model,X,y)
哪一個衡量基準呢?
============================
還有,進行特徵工程是X_train和X_test要一起進行
那我可以先將X進行特徵工程,再使用train_test_split拆開嗎?
回答列表
-
2019/06/25 下午 05:44張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
1. 評估模型/選擇模型的階段應該是用 `cross_val_score(model, X, y)` ,cross_val_score 會利用 model 將 X, y 交叉比較。
2. 特徵工程要看你這邊的 X_test 是真的 Testing Data ,還是作為 Validating Data 使用