logo
Loading...

cross_val_score相關問題 - Cupoy

有以下問題?1.cross_val_score 得到的分數如果愈高且愈接近1,代表預測愈好;那   ...

ml100-2-d19

cross_val_score相關問題

2019/09/30 下午 04:56
機器學習共學討論版
Claude
觀看數:13
回答數:3
收藏數:0
ml100-2-d19

有以下問題?


1.cross_val_score 得到的分數如果愈高且愈接近1,代表預測愈好;那 

    cross_val_score對我們在決定多少資料為訓練集和測試集有幫助嗎?還是單純只是 

    能判斷預測準確度的好壞呢

回答列表

  • 2019/10/01 上午 01:00
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    感覺上對於「決定多少資料為訓練集和測試集」應該是沒有關係的哦!

  • 2019/10/01 下午 01:37
    陳明佑 (Ming You Chen)
    贊同數:0
    不贊同數:0
    留言數:0

    請同學參考官方文件中, cross_val_score 裡面的參數解釋


    scoring (評分的標準) : 可以用這個參數指定替換成其他的metric

    不指定的話預設 regression 用 R^2, classification 用 accuracy


    cv (訓練與驗證集的切分方式) : 可以指定切分方式, 預設是切成3個 cross-validation

    理論上來說 : cv 切越多份越精準, 但也算得越久, 因此要看資料量與計算機能力而定

    除了預設外, 這個參數可以用三種方法設定訓練/驗證集 

    可以指定 cv 切分數量(整數) / cv的客製切分法(sklearn KFold物件) / 訓練驗證的 index array

    詳情請參閱官網文件 

    https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_score.html

  • 2019/10/01 下午 03:20
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    嗨, @明佑 專家的這一段文件跟問題的關係是什麼?有點接不起來。


    你回答的問題是「cv 切越多份越精準」,但原問題是「cv 會幫助決定多少資料為訓練集和測試集嗎」這兩件事是一樣的嗎?