cross_val_score相關問題
2019/09/30 下午 04:56
機器學習共學討論版
Claude
觀看數:13
回答數:3
收藏數:0
ml100-2-d19
有以下問題?
1.cross_val_score 得到的分數如果愈高且愈接近1,代表預測愈好;那
cross_val_score對我們在決定多少資料為訓練集和測試集有幫助嗎?還是單純只是
能判斷預測準確度的好壞呢
回答列表
-
2019/10/01 上午 01:00張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
感覺上對於「決定多少資料為訓練集和測試集」應該是沒有關係的哦!
-
2019/10/01 下午 01:37陳明佑 (Ming You Chen)贊同數:0不贊同數:0留言數:0
請同學參考官方文件中, cross_val_score 裡面的參數解釋
scoring (評分的標準) : 可以用這個參數指定替換成其他的metric
不指定的話預設 regression 用 R^2, classification 用 accuracy
cv (訓練與驗證集的切分方式) : 可以指定切分方式, 預設是切成3個 cross-validation
理論上來說 : cv 切越多份越精準, 但也算得越久, 因此要看資料量與計算機能力而定
除了預設外, 這個參數可以用三種方法設定訓練/驗證集
可以指定 cv 切分數量(整數) / cv的客製切分法(sklearn KFold物件) / 訓練驗證的 index array
詳情請參閱官網文件
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_score.html
-
2019/10/01 下午 03:20張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
嗨, @明佑 專家的這一段文件跟問題的關係是什麼?有點接不起來。
你回答的問題是「cv 切越多份越精準」,但原問題是「cv 會幫助決定多少資料為訓練集和測試集嗎」這兩件事是一樣的嗎?