ROC 曲線的閥值是什麼意思?
如題,模型不是已經給定了嗎,閥值是調了什麼呢? 我查到的資料是這個:https://zh.wikipedia.org/zh-tw/ROC曲线
回答列表
-
2019/05/20 下午 01:31陳明佑 (Ming You Chen)贊同數:1不贊同數:0留言數:0
所有分類器輸出, 都會有兩種
一種是分類預測(.predict), 以二元分類來說, 就是 0 或 1
另一種是類別的機率(.predict_proba), 有N種分類就該有N組機率, 同一筆資料的機率總和應該是 1
二元分類是其中的特例 : 本來該有2組機率, 但因為加起來為1, 因此只要留一組就好了
回到問題 : 閥值是什麼?
如果你的應用, 只需要"分類預測"而非機率,
那麼你可以設定一個值(例如 0.3), 大於這個數就分類為1, 小於就分類為0
這裡的 0.3 就稱為閥值, 我們會因為不同應用去調整閥值
例如 : 指紋辨識 - 閥值要很高, 因為錯放的代價很高
抗體健檢 - 閥值可以低一點, 因為偽陽性可以再做檢查就好
註 : sklearn 的分類預測是看哪一類別的機率高, 因此可以理解為閥值 = 0.5
-
2019/05/20 下午 01:36Jimmy贊同數:1不贊同數:0留言數:0
Hi robert!
平常我們在計算 accuracy 時,要先設定一個閥值,將原本的機率值轉變為標籤數字,例如機率 > 0.5,那就判定為 1,< 0.5 則判定為 0。所以在貳分類問題中, 0.5 的閥值是個很常用的值。
但這個值可以調整的,如果調整成 > 0.3 就判定成 1, < 0.3 判定成 0 也是可以,但可能會造成較多的誤報 (False Positive),AUC 就是在衡量在不同的閥值對 True Postive/ False Positive 的影響,透過不同閥值計算出 TP/FP ,然後畫出一條曲線,再計算曲線下的面積得到 AUC