day16 Bar & KDE (density plot)
2020/09/02 下午 11:45
機器學習共學討論版
阿嬤燒肉
觀看數:27
回答數:2
收藏數:0
ml100
day16
助教你好,我想請問從第一張圖( KDE )來看
我自己是理解成年齡層為 20~25 歲以及 65~70 歲的人相較其他年齡層,付不出錢的機率比較大。
但從第二張圖( Bar )來看
年齡層為 20~25 歲付不出錢的機率較大,但65~70 歲的人付不出錢的機率卻最小。
不知道是否是我對圖形觀察有誤,為何用同樣的資料畫出來的圖結果不太一樣?
回答列表
-
2020/09/03 下午 03:03Joe Stephen贊同數:0不贊同數:0留言數:1
第一張圖是每一個分組的機率分布,可以大概看出資料的分布情形。而這裡看的是年齡的分布,與付不出錢沒有關聯
例如:在資料裡年齡層為 20~25 歲的人,小於22歲的人占多少比例
所以,無法從第一張圖看出 年齡層為 20~25 歲以及 65~70 歲的人相較其他年齡層,付不出錢的機率比較大
-
2020/09/05 上午 00:02張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
補充一下:KDE 是指核密度估計(kernel density estimation)的圖,是用來判斷資料的分佈(密度)關係,類似於 histogram(直方圖) 的用法。他們都是用於一個欄位的資料,來看不同數值的分佈。
另外一種 長條圖(Bar Chart)則是用來觀察,兩個欄位間的比較關係。
如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕,也可以追蹤我的GITHUB 帳號。若還有問題的話,也歡迎再開一個新的問題繼續發問,或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個課程:【資料科學家的 12 堂心法課】,歡迎一起來玩玩!(By the way,我並不是主辦單位的人員,所以如果覺得我回答得不好,不要找他們抱怨/客訴XD)