logo
Loading...

day24 : 類別型特徵 - 基礎處理 label encoding - Cupoy

在教材中說到 Label Encoding 的缺點是分數的大小順序沒有意義但是在之前的章節有說到若原...

label encoding,day24

day24 : 類別型特徵 - 基礎處理 label encoding

2020/09/08 下午 00:13
機器學習共學討論版
阿嬤燒肉
觀看數:29
回答數:3
收藏數:0
label encoding
day24

在教材中說到 Label Encoding 的缺點是分數的大小順序沒有意義

但是在之前的章節有說到

若原始資料是有序離散值的話 適合使用 Label Encoding

也有舉例:以年齡分組,類別有小孩、年輕人、老人,使用標籤編碼表示為0, 1, 2是合理的,因為年齡上老人 > 年輕人、年輕人 > 小孩。

那為什麼教材會說 Label Encoding 的缺點是分數的大小順序沒有意義?

回答列表

  • 2020/09/08 下午 00:15
    張維元 (WeiYuan)
    贊同數:2
    不贊同數:0
    留言數:0

    嗨,我覺得是教材錯誤!Label Encoding 後的數字是有大小意義的沒錯


    如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕,也可以追蹤我的GITHUB 帳號。若還有問題的話,也歡迎再開一個新的問題繼續發問,或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個課程:【資料科學家的 12 堂心法課】,歡迎一起來玩玩!(By the way,我並不是主辦單位的人員,所以如果覺得我回答得不好,不要找他們抱怨/客訴XD)

  • 2020/09/10 上午 02:05
    陳在民 (TSAI-MIN CHEN)
    贊同數:0
    不贊同數:1
    留言數:1

    同學您好,這個問題這樣解釋比較恰當,當Label Encoding"轉換成分數(ex: 1,2)"時,其"數值大小順序"並不一定對應其"原始資料類別(ex: 南港區, 大安區)"的某種數學上位階的關係。

    除非,這個"原始資料類別(ex: 小孩、年輕人、老人)"剛好有某種數學上位階的關係,對應到他"轉換成分數"的Label Encoding(ex: 0, 1, 2)。

  • 2020/09/10 下午 03:25
    CUPOY
    贊同數:0
    不贊同數:0
    留言數:0

    哈囉~親愛的燒肉學員您好


    感謝您的提問與 Cupoy 專家的指正,內容已經修正完畢囉,祝福您學習愉快!