欄位選擇問題?
2019/04/25 下午 10:21
機器學習共學討論版
孫博彥
觀看數:5
回答數:1
收藏數:0
ml100-2
categorical
ml100-2-d10
對TARGET這種只有兩個數值,近似於Categorical的變數去算他跟各個Columns的相關係數不會非常不洽當嗎?
面對類別型態變數,利用分群後做類似T檢定的資料關查似乎才是比較好的做法吧?
畢竟和只有兩個數值,甚至0跟1是不是有數值上的意義都不知道的數值算相關係數,好像不太合理吧?
回答列表
-
2019/04/25 下午 10:31張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
Categorical 也有相關係數的算法,例如,Kendall。可以參考一下文件的用法:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.corr.html
不過就像你說的用分群跟檢定也是一種方法!