logo
Loading...

ROC 曲線的閥值是什麼意思? - Cupoy

如題,模型不是已經給定了嗎,閥值是調了什麼呢? 我查到的資料是這個:https://zh.wikip...

ml100-2,ml100-2-d30

ROC 曲線的閥值是什麼意思?

2019/05/18 下午 06:17
機器學習共學討論版
robert1003
觀看數:12
回答數:2
收藏數:1
ml100-2
ml100-2-d30

如題,模型不是已經給定了嗎,閥值是調了什麼呢? 我查到的資料是這個:https://zh.wikipedia.org/zh-tw/ROC曲线

回答列表

  • 2019/05/20 下午 01:31
    陳明佑 (Ming You Chen)
    贊同數:1
    不贊同數:0
    留言數:0

    所有分類器輸出, 都會有兩種

    一種是分類預測(.predict), 以二元分類來說, 就是 0 或 1

    另一種是類別的機率(.predict_proba), 有N種分類就該有N組機率, 同一筆資料的機率總和應該是 1

    二元分類是其中的特例 : 本來該有2組機率, 但因為加起來為1, 因此只要留一組就好了


    回到問題 : 閥值是什麼?

    如果你的應用, 只需要"分類預測"而非機率, 

    那麼你可以設定一個值(例如 0.3), 大於這個數就分類為1, 小於就分類為0

    這裡的 0.3 就稱為閥值, 我們會因為不同應用去調整閥值

    例如 : 指紋辨識 - 閥值要很高, 因為錯放的代價很高

    抗體健檢 - 閥值可以低一點, 因為偽陽性可以再做檢查就好

    註 : sklearn 的分類預測是看哪一類別的機率高, 因此可以理解為閥值 = 0.5

  • 2019/05/20 下午 01:36
    Jimmy
    贊同數:1
    不贊同數:0
    留言數:0

    Hi robert!


    平常我們在計算 accuracy 時,要先設定一個閥值,將原本的機率值轉變為標籤數字,例如機率 > 0.5,那就判定為 1,< 0.5 則判定為 0。所以在貳分類問題中, 0.5 的閥值是個很常用的值。


    但這個值可以調整的,如果調整成 > 0.3 就判定成 1, < 0.3 判定成 0 也是可以,但可能會造成較多的誤報 (False Positive),AUC 就是在衡量在不同的閥值對 True Postive/ False Positive 的影響,透過不同閥值計算出 TP/FP ,然後畫出一條曲線,再計算曲線下的面積得到 AUC