D6 範例One Hot encoding的地方不明白
2019/09/02 上午 01:01
機器學習共學討論版
Yu Chen Lin
觀看數:72
回答數:2
收藏數:0
ml100-3
ml100-3-d06
你好我不是很明白為什麼經過one hot encoding之後,原本的title "NAME_EDUCATION_TYPE" 會變成"NAME_EDUCATION_TYPE_Academic degree",如果照"CODE_GENDER"的命名的話那不是應該要變成
"NAME_EDUCATION_TYPE_Secondary / secondary special"跟"NAME_EDUCATION_TYPE_Higher education"嗎?可以請教經過one hot encoding之後的命名會如何改變嗎?
回答列表
-
2019/09/02 上午 10:08張維元 (WeiYuan)贊同數:0不贊同數:0留言數:1
嗨,如果你是用的 get_dummies 的話,那結果應該是用值與原本的欄位拼起來。除非你有做額外的設定,建議你可以先用小的範例試試看:
-
2019/09/03 上午 11:40陳明佑 (Ming You Chen)贊同數:0不贊同數:0留言數:1
我想同學你的問題, 應該是在於看錯行了
上面兩組輸出, 是前面下列兩行的結果 :
print(app_train['CODE_GENDER_F'].head())
print(app_train['CODE_GENDER_M'].head())而你說的這一行, 輸出結果是第三組 : 0 0 0 0 0
因此對應你看到的原始資料, 並沒有矛盾的地方