Emprical Cumulative Density 與Kernel Density Estimation 之間的關係?
如題:
想要請教一下,day9的Emprical Cumulative Density與day16的Kernel Density Estimation 之間的關係
Kernel Density Estimation 曲線的積分面積會接近Emprical Cumulative Density曲線上的值嘛?(因為有kernel的誤差所以不會完全相等這樣)
回答列表
-
2020/03/18 下午 09:12李子明贊同數:0不贊同數:0留言數:0
這裡分別縮寫為ECD與KDE,並用一般作圖的方式來描述。
ECD是只有最右邊的那個點的高度是一,因為相對比值的累積的關係;
KDE是線下面積是一,因為正規化(歸一化?標準化?)的關係。
ECD是向右累積,所以右邊的點的經驗,會包括左邊的點的經驗,再加上自己的經驗;
KDE是左鄰右舍的舉證,自己這個點的經驗,其實是左邊與右邊相鄰點的經驗加權平均得到的。
所以應該是沒有直接的關係。
-
2020/03/19 下午 10:05崴崴贊同數:不贊同數:留言數:
似乎可以用Gaussian kernel function作pdf導數的逼近?
想同問
根據Glivenko–Cantelli theorem
ECDF在i.i.d的樣本數夠大時會收斂到CDF
但是KDE還牽涉到bandwith跟kernel function的選擇
照這樣看不知道MISE是不是無法收斂到0?
而且這個誤差似乎不是kernel function造成而是bandwith造成的?
-
2020/03/21 上午 02:05張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
嗨,
簡單說明可以這樣想:
Emprical Cumulative Density:是真實資料的累積
Kernel Density Estimation:比較像是把長條圖進行正規化後的結果
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃