欄位選擇問題?
2019/04/25 10:21 下午
機器學習共學討論版
孫博彥
觀看數:3
回答數:1
收藏數:0
ml100-2
categorical
ml100-2-d10
對TARGET這種只有兩個數值,近似於Categorical的變數去算他跟各個Columns的相關係數不會非常不洽當嗎?
面對類別型態變數,利用分群後做類似T檢定的資料關查似乎才是比較好的做法吧?
畢竟和只有兩個數值,甚至0跟1是不是有數值上的意義都不知道的數值算相關係數,好像不太合理吧?