logo
Loading...

average silhouette_score問題 - Cupoy

問題1. 請問每個資料點的silhouette_score 的數學公式是不是1-(與同群資料距離平均...

average silhouette score

average silhouette_score問題

2020/05/20 下午 10:18
機器學習共學討論版
Nick
觀看數:18
回答數:6
收藏數:1
average silhouette score

問題1. 請問每個資料點的silhouette_score 的數學公式是不是1-(與同群資料距離平均/與第二近群資料距離平均)

問題2. 請問這樣意味著average silhouette_score最高---->該k值是最適合的分群值?

問題3. 承上題,所以選定k值的時候要選擇:

                 a. average silhouette_score最高的k值

                 b. average silhouette_score比下一個分群值的分數大很多的k值

問題4. 如果在下一個分群值的average silhouette_score不降反升,這有什麼含意嗎?

回答列表

  • 2020/05/22 下午 08:35
    Jeffrey
    贊同數:1
    不贊同數:1
    留言數:0

    1. 使用silhouette_score()方法,這個數值愈接近 1 表示績效愈好,反之愈接近 -1 表示績效愈差

    2. 分群演算法的績效可以使用 Silhouette 係數, 所以k值是最適合的分群值

  • 2020/05/23 上午 01:30
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    嗨,關於你的問題幾點回復:


    1. 請問每個資料點的silhouette_score 的數學公式是不是1-(與同群資料距離平均/與第二近群資料距離平均)


    => 原始公式如下,不一定等於 1-(與同群資料距離平均/與第二近群資料距離平均),要比較 a, b 的關係。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/05/23 上午 01:31
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    2. 請問這樣意味著average silhouette_score最高---->該k值是最適合的分群值?


    => 是的,我們利用 silhouette_score 來判斷哪一個 k 是最適合的群數


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/05/23 上午 01:32
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    3. 承上題,所以選定k值的時候要選擇:

                    a. average silhouette_score最高的k值

                    b. average silhouette_score比下一個分群值的分數大很多的k值


    => 「a. average silhouette_score最高的k值」,手肘法(elbow method)才是用比較來看


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/05/23 上午 01:32
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    4. 如果在下一個分群值的average silhouette_score不降反升,這有什麼含意嗎?


    => 代表分群效果更好 (?)


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃