day24 : 類別型特徵 - 基礎處理 label encoding
2020/09/08 下午 00:13
機器學習共學討論版
阿嬤燒肉
觀看數:29
回答數:3
收藏數:0
label encoding
day24
在教材中說到 Label Encoding 的缺點是分數的大小順序沒有意義
但是在之前的章節有說到
若原始資料是有序離散值的話 適合使用 Label Encoding
也有舉例:以年齡分組,類別有小孩、年輕人、老人,使用標籤編碼表示為0, 1, 2是合理的,因為年齡上老人 > 年輕人、年輕人 > 小孩。
那為什麼教材會說 Label Encoding 的缺點是分數的大小順序沒有意義?
回答列表
-
2020/09/08 下午 00:15張維元 (WeiYuan)贊同數:2不贊同數:0留言數:0
嗨,我覺得是教材錯誤!Label Encoding 後的數字是有大小意義的沒錯
如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕,也可以追蹤我的GITHUB 帳號。若還有問題的話,也歡迎再開一個新的問題繼續發問,或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個課程:【資料科學家的 12 堂心法課】,歡迎一起來玩玩!(By the way,我並不是主辦單位的人員,所以如果覺得我回答得不好,不要找他們抱怨/客訴XD)
-
2020/09/10 上午 02:05陳在民 (TSAI-MIN CHEN)贊同數:0不贊同數:1留言數:1
同學您好,這個問題這樣解釋比較恰當,當Label Encoding"轉換成分數(ex: 1,2)"時,其"數值大小順序"並不一定對應其"原始資料類別(ex: 南港區, 大安區)"的某種數學上位階的關係。
除非,這個"原始資料類別(ex: 小孩、年輕人、老人)"剛好有某種數學上位階的關係,對應到他"轉換成分數"的Label Encoding(ex: 0, 1, 2)。
-
2020/09/10 下午 03:25CUPOY贊同數:0不贊同數:0留言數:0
哈囉~親愛的燒肉學員您好
感謝您的提問與 Cupoy 專家的指正,內容已經修正完畢囉,祝福您學習愉快!
