不太理解KKN中補值的k要如何判斷要設定多少?
在講義中有提到K-Nearest Neighbor(KNN) 是一種無須機率分配的假設下的演算法,跟距離預測值最近的 k 個數值,來估計預測值。 那我們要如何判斷k值設定多少來進行補值為最加選擇,是一定要用均方誤差(Mean-Square Error)來判斷嗎? 因為有時候看到是k=1也有看到用k=3的時候所以不是很理解。
回答列表
-
2021/03/05 上午 11:33張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
嗨,你好
比較常見的方就像是你說直接用結果的(均方誤差,MSE)來判斷哪一個 K 最好。
嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤我的 Facebook 或 技術部落格 ,也會不定時的舉辦分享活動,一起來玩玩吧 ヽ(●´∀`●)ノ 以下分享一些我近期發表跟資料科學有關的文章,歡迎大家持續追蹤: ■ 資料分析工具那麼多,該怎麼選? 🛠️
■ 真.資料團隊與分工
■ 觀察資料的 N 件事 🔖
■ 資料前處理必須要做的事 - 資料清理與型態調整
-
2021/03/10 下午 11:47Mora贊同數:不贊同數:留言數:
(1)一定要用均方誤差(Mean-Square Error)來判斷嗎? 我們是用已知的資料來驗證補值的效果好不好,所以我們可以用 MSE 來判斷預測出來的結果和真實的差距,用來評估預測出來的結果和真實的差距的指標有很多種,在課堂中,我們採用最常用的評估方式來做判斷,不一定用均方誤差(Mean-Square Error)來判斷,其他用來評估模型指標也行。 (2)由於要評估當採用 KNN 時,哪一個 K 最好,所以我們要用 K=1時,計算 MSE, k=2,k=3....依序都要算 MSE,然後再評估哪一個 k 的 MSE 最小,則就是最好的k值。 謝謝你的提問~如果仍有疑問,歡迎再發問唷。