average silhouette_score問題
問題1. 請問每個資料點的silhouette_score 的數學公式是不是1-(與同群資料距離平均/與第二近群資料距離平均)
問題2. 請問這樣意味著average silhouette_score最高---->該k值是最適合的分群值?
問題3. 承上題,所以選定k值的時候要選擇:
a. average silhouette_score最高的k值
b. average silhouette_score比下一個分群值的分數大很多的k值
問題4. 如果在下一個分群值的average silhouette_score不降反升,這有什麼含意嗎?
回答列表
-
2020/05/22 下午 08:35Jeffrey贊同數:1不贊同數:1留言數:0
1. 使用
silhouette_score()方法,這個數值愈接近 1 表示績效愈好,反之愈接近 -1 表示績效愈差2. 分群演算法的績效可以使用 Silhouette 係數, 所以k值是最適合的分群值
-
2020/05/23 上午 01:30張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
嗨,關於你的問題幾點回復:
1. 請問每個資料點的silhouette_score 的數學公式是不是1-(與同群資料距離平均/與第二近群資料距離平均)
=> 原始公式如下,不一定等於 1-(與同群資料距離平均/與第二近群資料距離平均),要比較 a, b 的關係。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃
-
2020/05/23 上午 01:31張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
2. 請問這樣意味著average silhouette_score最高---->該k值是最適合的分群值?
=> 是的,我們利用 silhouette_score 來判斷哪一個 k 是最適合的群數
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃
-
2020/05/23 上午 01:32張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
3. 承上題,所以選定k值的時候要選擇:
a. average silhouette_score最高的k值
b. average silhouette_score比下一個分群值的分數大很多的k值
=> 「a. average silhouette_score最高的k值」,手肘法(elbow method)才是用比較來看
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃
-
2020/05/23 上午 01:32張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
4. 如果在下一個分群值的average silhouette_score不降反升,這有什麼含意嗎?
=> 代表分群效果更好 (?)
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃
