請問KNN遇到NaN的時候距離的運算會怎麼做?
2021/06/12 上午 00:37
探索性資料分析 (EDA) 遺失值與異常值的進階補值策略 (4/28更新)
許智堯
觀看數:31
回答數:1
收藏數:0
在課程裡說會直接忽略去做,可是實際下去操作似乎不是如此,例如第二筆和第九筆資料的距離,應該是1^2 + 3^2 + 3^2 再開根號 = 根號20 大約是4.... 可是在距離的表格中他寫了5....
回答列表
-
2021/06/12 下午 02:13Jaio贊同數:1不贊同數:0留言數:1
這個問題非常好,原因在於在補質時因為會缺少數據所以不能算真實的距離,所以 KNN 的作法是把非缺失質的距離乘上一個權重(放大非缺失值的距離),這個權重可以想成 (全部的特徵值除以當前使用(非缺失)的特徵值),在此那個 5.033223 怎麼出來的呢: (底下使用google計算機)  請問這樣有清楚嗎?