【QA】我們該如何給二分類模型好壞打分數?
我們需要用一些指標來辨別模型的好壞,並作為我們挑選的依據, 面對二分類問題(陰性/陽性、正確/錯誤)時,我們常用的指標稱為混淆矩陣(Confusion Matrix),其中也衍生出很多不同的指標。 下面我想跟大家討論一下不同指標的背後意義。
回答列表
-
2021/08/25 上午 11:15Chili贊同數:0不贊同數:0留言數:0
# 混淆矩陣 (假設模型要判斷結果是正向還是負向)  * True&False 代表預測結果與實際結果是否相同 * Positive & Negative 表示預測方式是正向還是負向 (當預測出來是正向,其為Positive;預測結果為負向時,為Negative) 當我預測某新聞報導結果為正確,且實際上這篇報導確實是正確的情況下,稱為True Positive。 反之,當我預測某新聞報導結果為不正確,且實際上這篇報導確實是假新聞情況下,稱為True Negative。 ... --- # 從混淆矩陣延伸出的指標 * Accuracy: Accuracy是最常用的指標,也就是將所有預測與實際相同的情況相加,並除以所有預測情形個數,也就是評估一模型,能成功預測到結果的準確度。  * Precision: 關注在True Positive身上,在預測正向(Positive)的情況下,成功預測到結果的比例。  * Recall : 同樣關注在True Positive身上,但其看重的是實際情況在正向(Positive)的情況下,預測也是正向(Positive)的比率。  * F1 Score: 當覺得Precision與Recall指標同等重要時,我們就用F1 Score來表示。  ---- - 參考答案來源: https://www.ycc.idv.tw/confusion-matrix.html