logo
Loading...

請問KNN遇到NaN的時候距離的運算會怎麼做? - Cupoy

在課程裡說會直接忽略去做,可是實際下去操作似乎不是如此,例如第二筆和第九筆資料的距離,應該是1^2 ...

請問KNN遇到NaN的時候距離的運算會怎麼做?

2021/06/12 上午 00:37
探索性資料分析 (EDA) 遺失值與異常值的進階補值策略 (4/28更新)
許智堯
觀看數:30
回答數:1
收藏數:0

在課程裡說會直接忽略去做,可是實際下去操作似乎不是如此,例如第二筆和第九筆資料的距離,應該是1^2 + 3^2 + 3^2 再開根號 = 根號20 大約是4.... 可是在距離的表格中他寫了5....

回答列表

  • 2021/06/12 下午 02:13
    Jaio
    贊同數:1
    不贊同數:0
    留言數:1

    這個問題非常好,原因在於在補質時因為會缺少數據所以不能算真實的距離,所以 KNN 的作法是把非缺失質的距離乘上一個權重(放大非缺失值的距離),這個權重可以想成 (全部的特徵值除以當前使用(非缺失)的特徵值),在此那個 5.033223 怎麼出來的呢: (底下使用google計算機) ![Q_A_如何用KNN補值.png](http://kwassistfile.cupoy.com/00000179FED315F9000000076375706F795F72656C65617365414E53/1623377370002/large) 請問這樣有清楚嗎?