請教一下 如何解讀Density Plot
2019/09/18 下午 02:06
機器學習共學討論版
黃向偉
觀看數:161
回答數:3
收藏數:0
ml100-3
ml100-3-d20
各位老師好,
我把範例[EDA] Heatmap & Grid-scatters中,樣本為1000的結果跑完了。
有疑問的部分有兩個:
1.對角畫線的註解為:Histogram,但結果看起來卻像是Density Plot,不知道是否為註解錯誤。
2.看不太懂左下角的Density Plot(紅色及橘色線條構成的圖)如何解讀。
回答列表
-
2019/09/18 下午 04:14計弘達贊同數:0不贊同數:0留言數:1
我試著用我的理解說明
1. 對角畫線的註解是錯的,實際上在 PairGrid.map_diag 裡呼叫的是 sns.kdeplot,如下程式行:
grid.map_diag(sns.kdeplot)
2. 對角線和左下角呼叫的都是 sns.kdeplot,其中的差別在於對角線的部分是「單變量」,是自己和自己的統計,畫出的是 univariate KDE,而左下角是「雙變量」,畫出的是 bivariate KDE,同時對x軸、和y軸計算密度,畫出的樣子就像等高線。紅色和黃色分別表示 TARGET == 0 和 TARGET == 1 (或相反,不確定,也是我的疑問)兩種類別的 bivariate KDE。
-
2019/09/19 上午 00:52張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
謝謝 @弘達 同學補充,第一點是註解誤植。第二點理解上可以用等高線的分佈來想。
-
2019/09/19 上午 04:44黃向偉贊同數:0不贊同數:0留言數:0
老師好,
我上網搜了一下,似乎左下角等高線的意義指的是第三軸的數值。
請問老師,下圖(取自範例[EDA] Heatmap & Grid-scatters中樣本為1000的結果)中的紅線及黃線代表什麼數值呢?
如果是0或1的話,為什麼會有深淺之分(如介於紅黃色之間的橘色)?