請問KNN遇到NaN的時候距離的運算會怎麼做?
2021/06/12 上午 00:37
探索性資料分析 (EDA) 遺失值與異常值的進階補值策略 (4/28更新)
許智堯
觀看數:30
回答數:1
收藏數:0
在課程裡說會直接忽略去做,可是實際下去操作似乎不是如此,例如第二筆和第九筆資料的距離,應該是1^2 + 3^2 + 3^2 再開根號 = 根號20 大約是4.... 可是在距離的表格中他寫了5....
回答列表
-
2021/06/12 下午 02:13Jaio贊同數:1不贊同數:0留言數:1
這個問題非常好,原因在於在補質時因為會缺少數據所以不能算真實的距離,所以 KNN 的作法是把非缺失質的距離乘上一個權重(放大非缺失值的距離),這個權重可以想成 (全部的特徵值除以當前使用(非缺失)的特徵值),在此那個 5.033223 怎麼出來的呢: (底下使用google計算機) ![Q_A_如何用KNN補值.png](http://kwassistfile.cupoy.com/00000179FED315F9000000076375706F795F72656C65617365414E53/1623377370002/large) 請問這樣有清楚嗎?