cross_val_score 比較分數要差多少才算好
2019/05/15 下午 11:21
機器學習共學討論版
吳瑞洲
觀看數:14
回答數:1
收藏數:0
ml100-2
ml100-2-d19
您好!D19~D21 都會使用 cross_val_score 得到的分數做比較,但是出來的分數差距會有 0.01, 0.001, 0.0001...不太懂的是
1. 以 esitmator 為 LogisticRegression 所以預設 scoring 為 accuracy 情況下,上面的分數差距不管有多小,分數大的就是比較好嗎?
2. cross_val_score 在不同的 scoring 類型裡面,分數差距的意義跟差多少才是有比較好,有相關的教材可以看嗎?
回答列表
-
2019/05/16 下午 07:08陳明佑 (Ming You Chen)贊同數:0不贊同數:1留言數:2
Ans. 1
如同學所說, 如果都用預設值, 在官網的說明中的3.2.3.1節提到
分類問題會用Accuracy, 回歸問題則是用R2
這兩個數值都是用接近 1 越好, 越小越差,
差別只在於R2可能小於0, 但 Accuracy 不會
Ans. 2
機器學習與統計的最大差別, 在於機器學習本身是沒有"標準差"這種概念的
所以並不像統計一樣, 有95信心水準, 有虛無假設, 有p值小於0.05為顯著這種概念
所以差多少才足夠好, 沒有通用的檢驗標準,
完全取決於資料集與你選用的模型而定