logo
Loading...

KDE(核密度函數)和直方圖分析資料的差異? - Cupoy

想請問關於day11中的 KDE (核密度函數)和直方圖一同分析相同的資料 能看出何種差異?雖然這感...

ml100-2,kde,ml100-2-d11

KDE(核密度函數)和直方圖分析資料的差異?

2019/04/30 下午 04:03
機器學習共學討論版
嘉瑜陳
觀看數:12
回答數:3
收藏數:1
ml100-2
kde
ml100-2-d11

想請問關於day11中的 KDE (核密度函數)

和直方圖一同分析相同的資料 能看出何種差異?

雖然這感覺和程式比較無關但還是想知道

KDE在分析何種資料上 效益會高於直方圖呢

回答列表

  • 2019/04/30 下午 04:47
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    直方圖(Histgram)的 X 軸是離散的區間,他是透過裝箱計數的方式來比較差異,因此圖形可能會受到裝箱的規則產生差異。可以把 KDE 想像成是連續的的 Histogram ,我們也常說 KDE 是一種 histogram 的變形,因為連續所以其圖表示唯一的。


    以下附一張, Histogram 與 KDE 的比較:


  • 2019/04/30 下午 07:44
    Seanyu.TW
    贊同數:0
    不贊同數:0
    留言數:0

    Hi, 補充一下

    直方圖的優點是畫起來很快,但是它為人詬病的問題是必須切 bins, 而 bins 到底要訂多少,以及假如有極端的 outliers,則整個圖會走樣的非常嚴重;反之,KDE 是將分布估算出來並以密度呈現,優點是畫起來不用擔心到底要定 bin 是多少,缺點當然是它得計算,畫起來相對就會久一些。

  • 2019/04/30 下午 07:45
    Seanyu.TW
    贊同數:0
    不贊同數:0
    留言數:0

    嚴格來說,並沒有說哪個時候效益會讓哪個圖比另一種高。如果讓我選,我可能會選擇畫一個 hist 來確認有沒有非常極端的值,而用抽樣方式來劃一張 KDE 用以觀察分布。