logo
Loading...

使用silhouette score判斷分群的優點是? - Cupoy

範例說用silhouette score判斷分群的方式是:如果是一個適合的分群值, 應該要比下一個分...

ml100-2,ml100-2-d56

使用silhouette score判斷分群的優點是?

2019/08/10 下午 11:45
機器學習共學討論版
辛普恩
觀看數:78
回答數:1
收藏數:0
ml100-2
ml100-2-d56

範例說用silhouette score判斷分群的方式是:如果是一個適合的分群值, 應該要比下一個分群值的分數大很多。有兩個問題

1. 所謂大很多是指大多少?

2. 底下兩個case用silhouette score判斷的話,case1最適合的k=3, case 2 最適合的k=4, 但如果用distortion cost function判斷拐點的方式兩個case最適合k都是5。請問用silhouette score的優點是什麼?感覺很容易出現誤判的狀況


回答列表

  • 2019/08/11 下午 07:57
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    嗨,我們可以先比較一下這兩個公式:


    1. elbow method 是考慮每一群的 SSE 最小,他並沒有考慮到群跟群的關係

    2. silhouette score 是從原始分群的定義上思考,同時滿足「群內差距小,群間差異大」的目標


    所以回到你的兩個問題,我都覺得沒有一個標準的答案,還是會建議你做實驗觀察。