logo
Loading...

類別型特徵類別太多處理辦法?準確率大都來自於 預測為0/實際為0,模型實用性不高 - Cupoy

您好,我想請問有一筆資料,大部分都是類別型資料,轉成獨熱編碼後,有100多行,但多數資料都變為0,只...

ml100

類別型特徵類別太多處理辦法?準確率大都來自於 預測為0/實際為0,模型實用性不高

2020/06/14 上午 05:34
機器學習共學討論版
闕浚恩
觀看數:8
回答數:1
收藏數:0
ml100

您好,


我想請問有一筆資料,大部分都是類別型資料,


轉成獨熱編碼後,有100多行,但多數資料都變為0,只有少數為1,


代入模型預測後,準確率大都來自於 預測為0/實際為0,感覺模型實用性不高


請問有較好的方式作資料預處理嗎?

回答列表

  • 2020/06/16 上午 01:11
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:1

    嗨,浚恩


    這是因為 OneHot 造成的稀疏矩陣問題,可以利用降維的方法先篩選掉一些資料。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃