D26 雜湊編碼的邏輯回歸是否要拿掉標籤編碼?
2020/09/14 下午 08:01
類別型特徵 - 其他進階處理
蘇蔚廷
觀看數:8
回答數:2
收藏數:1
下圖為對照用的標籤編碼後的邏輯回歸
然後題目要求要使用計數編碼、雜湊編碼以及計數+雜湊編碼再進行邏輯回歸
結果如下圖(圖為雜湊編碼+邏輯回歸)
想請問在使用雜湊編碼時,不用將原本標籤編碼的欄位刪除嗎?
因為計數編碼本身可以作為一種特徵保留,所以可以跟標籤編碼一起使用。
但是雜湊編碼和標籤編碼的作用應該是類似的,所以在這個題目中刪除掉標籤編碼後的ticket欄位
是不是比較合乎流程?
回答列表
-
2020/09/14 下午 08:56張維元 (WeiYuan)贊同數:2不贊同數:0留言數:0
嗨,這個問題很好
我覺得是「需要將原本的欄位刪掉的」,不然會影響到計算的權重。
如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕,也可以追蹤我的GITHUB 帳號。若還有問題的話,也歡迎再開一個新的問題繼續發問,或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個課程:【資料科學家的 12 堂心法課】或加入我自己的Line 群組社群,歡迎一起來玩玩!(By the way,我並不是主辦單位的人員,所以如果覺得我回答得不好,不要找他們抱怨/客訴XD)
-
2020/09/15 上午 00:52陳明佑 (Ming You Chen)贊同數:2不贊同數:0留言數:0
對的
雜湊編碼功能上是取代原本的標籤編碼
所以舊的編碼要刪除