logo
Loading...

不太理解KKN中補值的k要如何判斷要設定多少? - Cupoy

在講義中有提到K-Nearest Neighbor(KNN) 是一種無須機率分配的假設下的演算法,跟...

不太理解KKN中補值的k要如何判斷要設定多少?

2021/03/04 下午 10:24
探索性資料分析 (EDA) 遺失值與異常值的進階補值策略 (4/28更新)
曾彥婷
觀看數:121
回答數:2
收藏數:0

在講義中有提到K-Nearest Neighbor(KNN) 是一種無須機率分配的假設下的演算法,跟距離預測值最近的 k 個數值,來估計預測值。 那我們要如何判斷k值設定多少來進行補值為最加選擇,是一定要用均方誤差(Mean-Square Error)來判斷嗎? 因為有時候看到是k=1也有看到用k=3的時候所以不是很理解。

回答列表

  • 2021/03/05 上午 11:33
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    嗨,你好
    比較常見的方就像是你說直接用結果的(均方誤差,MSE)來判斷哪一個 K 最好。

    嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤我的 Facebook技術部落格 ,也會不定時的舉辦分享活動,一起來玩玩吧 ヽ(●´∀`●)ノ 以下分享一些我近期發表跟資料科學有關的文章,歡迎大家持續追蹤: ■ 資料分析工具那麼多,該怎麼選? 🛠️
    真.資料團隊與分工
    觀察資料的 N 件事 🔖
    資料前處理必須要做的事 - 資料清理與型態調整

  • 2021/03/10 下午 11:47
    Mora
    贊同數:
    不贊同數:
    留言數:

    (1)一定要用均方誤差(Mean-Square Error)來判斷嗎? 我們是用已知的資料來驗證補值的效果好不好,所以我們可以用 MSE 來判斷預測出來的結果和真實的差距,用來評估預測出來的結果和真實的差距的指標有很多種,在課堂中,我們採用最常用的評估方式來做判斷,不一定用均方誤差(Mean-Square Error)來判斷,其他用來評估模型指標也行。 (2)由於要評估當採用 KNN 時,哪一個 K 最好,所以我們要用 K=1時,計算 MSE, k=2,k=3....依序都要算 MSE,然後再評估哪一個 k 的 MSE 最小,則就是最好的k值。 謝謝你的提問~如果仍有疑問,歡迎再發問唷。