KDE問題
2019/09/21 上午 00:34
機器學習共學討論版
黃晨竣
觀看數:27
回答數:1
收藏數:1
day16
kernel density estimation
kdeplot
助教你好,我想要問解讀問題,KDE觀念不太懂,KDE 曲線下面積為1,
我想討論 TARGET=1 情況,問題如下:
(1) 因為我們將年紀分成10個群,也就是 bins = 10 以KDE來說,就是bandwidth = 10對吧?
(2) 那所說的面積指的是 (20.0, 25.0] 這一群的積分回去,面積 = 1 對吧 ? 還是指 10個群所有積分為1?我覺得是前者,如果是後者為什麼? 我一直搞不懂
(3) KDE的概念,是指我把離散的數據(直方圖) 轉換成 連續型的 PDF 概念對嗎?
那為什麼要這樣轉換,離散型不就有單點或是此區間的機率了嗎?轉換成連續型的意義在哪邊啊?
(4) KDE背後想表達的意涵,我看完教材與補充後,我認為是要表示此點(藉由附近的值)出現的情形去表示這個點的機率 ?那如果單就這張圖的話,因為 TARGET=1代表可能違約(付不出錢),因此我推測表示的意涵為年輕人20~25 以及老年人 65~70相較其他年齡族群,付不出錢的機率較大,這樣表示對嗎 ?
謝謝助教,再麻煩您跟我解釋一下,我真的這一單元看得目煞煞
補充一下,作完最後一小題後,發現是年輕人20~25歲違約機率較大耶!跟我推斷不一樣,所以 KDE 到底怎麼看,之前看文章寫得峰值往右,我不是很瞭解,想再請各位專家與助教解釋,真心感謝
回答列表
-
2019/12/18 上午 01:22Jeffrey贊同數:0不贊同數:0留言數:0