logo
Loading...

D26 雜湊編碼的邏輯回歸是否要拿掉標籤編碼? - Cupoy

下圖為對照用的標籤編碼後的邏輯回歸然後題目要求要使用計數編碼、雜湊編碼以及計數+雜湊編碼再進行邏輯回...

D26 雜湊編碼的邏輯回歸是否要拿掉標籤編碼?

2020/09/14 下午 08:01
類別型特徵 - 其他進階處理
蘇蔚廷
觀看數:8
回答數:2
收藏數:1

下圖為對照用的標籤編碼後的邏輯回歸


然後題目要求要使用計數編碼、雜湊編碼以及計數+雜湊編碼再進行邏輯回歸

結果如下圖(圖為雜湊編碼+邏輯回歸)

想請問在使用雜湊編碼時,不用將原本標籤編碼的欄位刪除嗎?

因為計數編碼本身可以作為一種特徵保留,所以可以跟標籤編碼一起使用。

但是雜湊編碼和標籤編碼的作用應該是類似的,所以在這個題目中刪除掉標籤編碼後的ticket欄位

是不是比較合乎流程?

回答列表

  • 2020/09/14 下午 08:56
    張維元 (WeiYuan)
    贊同數:2
    不贊同數:0
    留言數:0

    嗨,這個問題很好


    我覺得是「需要將原本的欄位刪掉的」,不然會影響到計算的權重。


    如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕,也可以追蹤我的GITHUB 帳號。若還有問題的話,也歡迎再開一個新的問題繼續發問,或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個課程:【資料科學家的 12 堂心法課】或加入我自己的Line 群組社群,歡迎一起來玩玩!(By the way,我並不是主辦單位的人員,所以如果覺得我回答得不好,不要找他們抱怨/客訴XD)

  • 2020/09/15 上午 00:52
    陳明佑 (Ming You Chen)
    贊同數:2
    不贊同數:0
    留言數:0

    對的  

    雜湊編碼功能上是取代原本的標籤編碼

    所以舊的編碼要刪除