logo
Loading...

數值型特徵 - 補缺失值與標準化 - 機器學習百日 - Cupoy

今天的內容會帶大家了解 處理缺失值、資料標準化意義、標準化使用時機、最大化最小化時機 填補缺值方法 1. 填補平均值、中位數、眾數 2. 填補指定值(須對欄位領域知識有了解) 3. 填...

今天的內容會帶大家了解 處理缺失值、資料標準化意義、標準化使用時機、最大化最小化時機 填補缺值方法 1. 填補平均值、中位數、眾數 2. 填補指定值(須對欄位領域知識有了解) 3. 填補預測值(須提防 overfitting) 最大準則為不要破壞資料分布~ 標準化可以平衡數值特徵間的影響力 最大化、最小化對極端數值較為敏感 所以如果資料不會有極端值,或已經去極端值,就適合用最大最小化,否則請用標準化 有了大概的理解之後,我們開始今天的學習吧!!!