logo
Loading...

請問如何判斷相異值「有限」或「不太具有代表性」? 又為何處理方式是「轉成文字」或「做標籤編碼」? - Cupoy

在範例第6行,有2組特徵處理,分別是:# 四個數值欄位, 因為相異值有限, 轉成文字# 相異值不太具...

ml100-2,ml100-2-d49

請問如何判斷相異值「有限」或「不太具有代表性」? 又為何處理方式是「轉成文字」或「做標籤編碼」?

2019/08/21 02:51 PM
機器學習新手論壇
redcard
觀看數:0
回答數:1
收藏數:0
ml100-2
ml100-2-d49

在範例第6行,有2組特徵處理,分別是:

# 四個數值欄位, 因為相異值有限, 轉成文字

# 相異值不太具有代表性的, 做標籤編碼


請問如何判斷相異值「有限」或「不太具有代表性」?

又為何處理方式是「轉成文字」或「做標籤編碼」?