類別型特徵類別太多處理辦法?準確率大都來自於 預測為0/實際為0,模型實用性不高
2020/06/14 上午 05:34
機器學習共學討論版
闕浚恩
觀看數:8
回答數:1
收藏數:0
ml100
您好,
我想請問有一筆資料,大部分都是類別型資料,
轉成獨熱編碼後,有100多行,但多數資料都變為0,只有少數為1,
代入模型預測後,準確率大都來自於 預測為0/實際為0,感覺模型實用性不高
請問有較好的方式作資料預處理嗎?
回答列表
-
2020/06/16 上午 01:11張維元 (WeiYuan)贊同數:1不贊同數:0留言數:1
嗨,浚恩
這是因為 OneHot 造成的稀疏矩陣問題,可以利用降維的方法先篩選掉一些資料。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃