logo
Loading...

類別型特徵處理方式 - Cupoy

您好,講義中提到以下兩個原則:1. 類別型特徵建議預設採⽤用標籤編碼。2. 除非該特徵重要性高,且可...

ml100-2,ml100-2-d22,類別型特徵

類別型特徵處理方式

2019/05/07 03:59 AM
機器學習新手論壇
蔡汶修
觀看數:0
回答數:2
收藏數:0
ml100-2
ml100-2-d22
類別型特徵

您好,講義中提到以下兩個原則:

1. 類別型特徵建議預設採⽤用標籤編碼。

2. 除非該特徵重要性高,且可能值較少(獨熱編碼時負擔較低) 時,才應考慮使⽤用獨熱編碼。


如講義所說,名目型的類別資料在「標籤編碼」下是沒有太大意義的,理論上應不存在 台北市>新竹市 or 新竹市>台北市...等隱含意義。


類別資料大致可區分為:名目型資料、次序型資料。

因此,該原則是否建議改為不論重要性高低,「名目型資料」使用「獨熱編碼」; 「次序型資料」使用「標籤編碼」?


以上思考不確定是否有誤解的部分,還請參考,謝謝。


BR,

Kam