KDE(核密度函數)和直方圖分析資料的差異?
2019/04/30 下午 04:03
機器學習共學討論版
嘉瑜陳
觀看數:12
回答數:3
收藏數:1
ml100-2
kde
ml100-2-d11
想請問關於day11中的 KDE (核密度函數)
和直方圖一同分析相同的資料 能看出何種差異?
雖然這感覺和程式比較無關但還是想知道
KDE在分析何種資料上 效益會高於直方圖呢
回答列表
-
2019/04/30 下午 04:47張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
直方圖(Histgram)的 X 軸是離散的區間,他是透過裝箱計數的方式來比較差異,因此圖形可能會受到裝箱的規則產生差異。可以把 KDE 想像成是連續的的 Histogram ,我們也常說 KDE 是一種 histogram 的變形,因為連續所以其圖表示唯一的。
以下附一張, Histogram 與 KDE 的比較:
-
2019/04/30 下午 07:44Seanyu.TW贊同數:0不贊同數:0留言數:0
Hi, 補充一下
直方圖的優點是畫起來很快,但是它為人詬病的問題是必須切 bins, 而 bins 到底要訂多少,以及假如有極端的 outliers,則整個圖會走樣的非常嚴重;反之,KDE 是將分布估算出來並以密度呈現,優點是畫起來不用擔心到底要定 bin 是多少,缺點當然是它得計算,畫起來相對就會久一些。
-
2019/04/30 下午 07:45Seanyu.TW贊同數:0不贊同數:0留言數:0
嚴格來說,並沒有說哪個時候效益會讓哪個圖比另一種高。如果讓我選,我可能會選擇畫一個 hist 來確認有沒有非常極端的值,而用抽樣方式來劃一張 KDE 用以觀察分布。