若相關係數很低該如何處理?
2019/04/26 下午 10:05
機器學習共學討論版
Ken Hu
觀看數:0
回答數:1
收藏數:0
ml100-2
app_train
ml100-2-d10
在做HW10時
檢視了app_train各欄位的相關係數
與TARGET最高的相關係數也只有0.07左右
想請問:
在實際應用時
如果發現資料集裡所有欄位與所要預測的標籤欄位的相關係數都像這樣非常低
這樣的資訊
對我們接下來要進行的訓練工作
會帶來什麼啟發 或是 要做什麼調整呢 ?
回答列表
-
2019/04/27 上午 00:28張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
1. 會帶來什麼啟發?
- 可能收集的資料都不足以拿來做分類
- 或是資料太雜亂,導致屬性的相關性被低估
2. 要做什麼調整呢?
- 透過特徵工程的方法,把影響資料的欄位拿掉
- 透過特徵組合的方法,把比較重要的欄位拉出來