logo
Loading...

Day062 S型散布圖資料X和color怎麼取得的? - Cupoy

這裡有2個問題(1) 根據文件,回傳的第一個X是資料沒錯,但回傳的第2個資料為什麼是color?ht...

ml100-2,ml100-2-d62

Day062 S型散布圖資料X和color怎麼取得的?

2019/07/08 上午 00:27
機器學習共學討論版
JJLai
觀看數:57
回答數:2
收藏數:0
ml100-2
ml100-2-d62

這裡有2個問題

(1) 根據文件,回傳的第一個X是資料沒錯,但回傳的第2個資料為什麼是color?

https://scikit-learn.org/stable/modules/generated/sklearn.datasets.make_s_curve.html

(2) X的3個column的資料是什麼,為什麼繪圖只用X[:, 0]和X[:, 2]

以下是畫原圖的程式碼

回答列表

  • 2019/07/12 上午 02:08
    劉珍銘
    贊同數:1
    不贊同數:0
    留言數:0

    1.  

    datasets.samples_generator.make_s_curve

    回傳的 t 是每筆資料相對應的一個 float 值代表著一個連續的標籤表示資料所處的位置或是相似程度。譬如會回傳的值分布於 -5 到 +5 之間其中一個數, -5 跟 -3 就會比 -5 跟 +3 來的相似。把這些數字帶入 ax.scatter(X[:, 0], X[:, 2], c=color) 資料視覺化後就會把 -5 到 +5 之間的數字用顏色來表示,越接近的數字顏色也會越相似方便人眼辨識。所以這邊才把此變數名稱命名為 color


    2. 

    X 每筆資料有三個維度,二維平面圖無法繪製出三維的圖,因此只取兩個維度來顯示。

    會取 X[:, 0] 和 X[:, 2] 主要是因為資料的 S 帶狀分布大概是以 xz 平面呈現。取這兩個維度來顯示肉眼最容易辨識。你可以試著取 X[:, 0] 和 X[:, 1] 看看以不同角度去看資料的樣子,差距很大的資料就會交疊起來了,很難看出資料是以 S 帶狀的樣貌。

  • 2019/07/12 下午 01:10
    陳明佑 (Ming You Chen)
    贊同數:0
    不贊同數:0
    留言數:0

    非常感謝劉同學的回答

    您回答得很正確