logo
Loading...

D6 範例One Hot encoding的地方不明白 - Cupoy

你好我不是很明白為什麼經過one hot encoding之後,原本的title "NAME_EDU...

ml100-3,ml100-3-d06

D6 範例One Hot encoding的地方不明白

2019/09/02 上午 01:01
機器學習共學討論版
Yu Chen Lin
觀看數:72
回答數:2
收藏數:0
ml100-3
ml100-3-d06

你好我不是很明白為什麼經過one hot encoding之後,原本的title "NAME_EDUCATION_TYPE" 會變成"NAME_EDUCATION_TYPE_Academic degree",如果照"CODE_GENDER"的命名的話那不是應該要變成

"NAME_EDUCATION_TYPE_Secondary / secondary special"跟"NAME_EDUCATION_TYPE_Higher education"嗎?可以請教經過one hot encoding之後的命名會如何改變嗎?

回答列表

  • 2019/09/02 上午 10:08
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:1

    嗨,如果你是用的 get_dummies 的話,那結果應該是用值與原本的欄位拼起來。除非你有做額外的設定,建議你可以先用小的範例試試看:


  • 2019/09/03 上午 11:40
    陳明佑 (Ming You Chen)
    贊同數:0
    不贊同數:0
    留言數:1

    我想同學你的問題, 應該是在於看錯行了

    上面兩組輸出, 是前面下列兩行的結果 :

    print(app_train['CODE_GENDER_F'].head())
    print(app_train['CODE_GENDER_M'].head())

    而你說的這一行, 輸出結果是第三組 : 0 0 0 0 0

    因此對應你看到的原始資料, 並沒有矛盾的地方