想請問說運用KNN是補值,提高變數間的相關性,是否有助於之後的模型預測?
2021/05/10 上午 09:31
探索性資料分析 (EDA) 遺失值與異常值的進階補值策略 (4/28更新)
葉育承
觀看數:17
回答數:2
收藏數:0
在進行KNN補值時,去估算參與變數間的相關性,使補出來的值較為的正確,是否會助於之後的分析,或模型的預估上,還是不太影響到整體(主要是基於變數跟目標的相關性)?
回答列表
-
2021/05/11 上午 01:49張維元 (WeiYuan)贊同數:0不贊同數:0留言數:2
嗨,你好
這樣是不是有一點偷看答案的感覺?好像哪裡怪怪的。
嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤 我的粉絲專頁 ヽ(●´∀`●)ノ
-
2021/05/12 下午 02:08Paul贊同數:0不贊同數:0留言數:0
KNN補值的確會讓數值變化平緩,因為缺失值都以鄰居取代,但是否會造成之後的分析更準確,其實難說,因為也許這些預估的缺失值和事實相差很大,另外KNN本身也有參數要調校,所以更需要領域專家協助。