logo
Loading...

sklearn silhouette_samples 參數問題 - Cupoy

api裡silhouette_samples回傳的是一個跟樣本數一樣大的array為什麼可以用[cl...

ml100-2-d56,ml100-2

sklearn silhouette_samples 參數問題

2019/08/10 下午 08:19
機器學習共學討論版
辛普恩
觀看數:27
回答數:2
收藏數:0
ml100-2-d56
ml100-2

api裡silhouette_samples回傳的是一個跟樣本數一樣大的array

為什麼可以用[cluster_labels==i]這種篩選方式取值?


sample_silhouette_values = silhouette_samples(X, cluster_labels)

for i in range(n_clusters):

    ith_cluster_silhouette_values = sample_silhouette_values[cluster_labels == i]

回答列表

  • 2019/08/11 下午 08:06
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:1

    嗨,你可以把這三個值印出來看看:


    • i
    • cluster_labels
    • sample_silhouette_values

  • 2019/08/18 上午 00:36
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    那個,你把 sample_silhouette_values 變數印出來就知道,他是一個 n 維陣列 。cluster_labels 這個是說 sample_silhouette_values 中,每一個維度是屬於哪一個 cluster_label。用 [cluster_labels == i] 即可以把 sample_silhouette_values 結果中,cluster_label  等於 i 的維度印出來。


    n 維陣列可以用遮罩的方法選取資料!