看不懂特徵雜湊的說明跟程式碼中hash指令的關聯
2019/05/11 下午 10:21
機器學習共學討論版
Benjamin Shao
觀看數:2
回答數:1
收藏數:0
ml100-2
ml100-2-d24
初步看了特徵雜湊的說明 有點像是對於不同的字的出現頻率給予一個賦予值 再將每個特徵裡面出現的字根據他們的出現頻率給予賦值 這跟程式碼中給予Cabin中的文字hash有什麼關聯嗎?
回答列表
-
2019/05/13 下午 00:06陳明佑 (Ming You Chen)贊同數:1不贊同數:0留言數:0
你可以把hash看作一種隨機碼, 只是同一個字放入hash以後的隨機結果會一樣
後面再取%(取餘數), 只是為了讓不同的隨機碼可以合併成少數類別而已
也因為是隨機, 無法保證這是有意義的, 因此雜湊編碼的效果有限