logo
Loading...

分群與輪廓係數問題 - Cupoy

1. 在pdf中提到「平均值觀察 計算分群的輪廓分數總平均,分的群數越多應該分數越⼩,如果總平均值沒...

day_056_hw,silhouette_score,ml100-2,ml100-2-d56

分群與輪廓係數問題

2019/06/23 08:49 AM
機器學習新手論壇
JS
觀看數:0
回答數:2
收藏數:0
day_056_hw
silhouette_score
ml100-2
ml100-2-d56

1. 在pdf中提到「平均值觀察 計算分群的輪廓分數總平均,分的群數越多應該分數越⼩,如果總平均值沒有隨著分群數增加⽽變小,就說明了那些分數較不洽當」

請問這句話的意思是,若隨著分群數增加,而那條垂直的紅色虛線卻沒有往左邊移動的話,代表分群效果並不好?但搭配希望輪廓係數越大代表分群越好的概念來想,這意味在做分群時希望群數越少越好嗎?



2. 程式碼當中註解提到「觀察輸出值 : silhouette_score, 如果是一個適合的分群值, 應該要比下一個分群值的分數大很多.由結果可以看出 : 2, 3, 5 都是不錯的分群值(因為比 3, 4, 6的分數都高很多), 相形之下, 4, 6, 7 作為分群的效果就不明顯」

想請問

(1)輪廓係數不是越大就代表這樣的分群越好嗎,為什麼要比下一個分群值大很多呢?

(2)那如果輪廓係數偏低,卻比下一個分群值大很多,這樣也代表他是好的分群嗎?


3. 請問輪廓係數的圖應該怎麼解讀?

像是他越接近0的地方的寬窄程度、每群超過紅色虛線的面積多寡、每個顏色代表的群是面積越相近或越對齊越好嗎、為什麼像藍色最上方尖點和下緣差距較明顯等等

他們各自代表什麼含義呢?


謝謝!