logo
Loading...

Github上傳作業出現錯誤 - Cupoy

在 day 48 的 kaggle 比賽中,我看到一個 0.99 以上 accuracy 的 not...

ml100-3,ml100-3-d48,gaussian mixture

Github上傳作業出現錯誤

2019/10/15 05:00 AM
機器學習新手論壇
吳海成
觀看數:0
回答數:2
收藏數:1
ml100-3
ml100-3-d48
gaussian mixture

在 day 48 的 kaggle 比賽中,我看到一個 0.99 以上 accuracy 的 notebook


https://www.kaggle.com/chahat1/data-science-london-classification


他的致勝關鍵是用了 GaussianMixture 把 feature 轉換,然後才放進 estimator 去 fit  和 predict。


請問在什麼情況下會用 GaussianMixture 來做 feature engineering? 


另外為什麼 GuassianMixture 在這例子中效果會這麼顯著?其他的 preprocessing 例如 PCA, StandardScaler 等基本上作用不大,但 GaussianMixture 一下子便把 accuracy 由 0.9 推上 0.99 了...