關於決策樹的問題
2020/04/29 下午 11:28
機器學習共學討論版
Jeff Huang
觀看數:12
回答數:3
收藏數:0
您好,想請問資料有沒有標準化/正規化對於決策樹的預測結果會有影響嗎?
我實際做出來好像不會有影響,想知道這是對的嗎??
回答列表
-
2020/04/30 上午 10:52Timmy贊同數:1不贊同數:0留言數:0
在分類問題時使用樹狀模型 資料經過標準化對預測結果不會有影響喔
可以參考Day12 有提到
-
2020/04/30 上午 10:54徐正憲贊同數:0不贊同數:0留言數:1
我個人經驗是Tree based model對於離群值比較不敏感,
直覺是樹對變數分segment是盡量讓左右兩群使得gini或entropy最小(以CART為例),
其公式跟變數值大小比較沒有直接關係,
如果是羅吉斯回歸或是類神經網絡,
就需要求導算出係數,
此時若有離群值就會影響係數估計,
以上是個人淺見,如果有誤請糾正
-
2020/05/01 下午 00:37張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
嗨,Jeff Huang
這樣是對的,標準化/正規化是基於距離產生的影響,但決策樹是以「資訊量」作為考量,所以比較沒有差。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃