使用hash function取餘數編碼，跟隨機給一個數字編碼的差異？是否可使用其他方式編碼?

Ans1.

差別在於hash+餘數可以使得同樣的內容, 不管算多少次都會是同一個值

如果取隨機就未必能取到相同值, 所以有意義

Ans2.

真的有使用高斯函數的編碼, 教我的那位稱這編碼方式為 Gauss Rank

當某個欄位確定是排名值, 數值從 1 到 n,

此時就應該使用常態分布 CDF 的反函數編碼,

例如 n = 100, 就依照百分等級對應的幾個標準差來編碼

因為我們知道, 第1與第2名的差距, 絕對比中段差1名的差距大

因此, 課程中這些編碼方式, 只是跟同學舉例

並不是要同學侷限自己, 只能做這些編碼

而是要結合對資料的了解, 以及對統計知識的了解, 設計最適合的編碼

就像同學你基於自己對統計的理解, 而對這些編碼方式有質疑, 這是非常棒的態度 ^^