請問如何判斷相異值「有限」或「不太具有代表性」? 又為何處理方式是「轉成文字」或「做標籤編碼」?
2019/08/21 10:51 下午
機器學習共學討論版
redcard
觀看數:18
回答數:1
收藏數:0
ml100-2
ml100-2-d49
在範例第6行,有2組特徵處理,分別是:
# 四個數值欄位, 因為相異值有限, 轉成文字
# 相異值不太具有代表性的, 做標籤編碼
請問如何判斷相異值「有限」或「不太具有代表性」?
又為何處理方式是「轉成文字」或「做標籤編碼」?