請問Unsupervised Learning 的前期工作
2019/11/02 下午 03:33
機器學習共學討論版
William Mok
觀看數:20
回答數:3
收藏數:0
ml100-3-d54
是否需要和 Supervised Learning 一樣,前期需要進行EDA, missing data, outlier, remove correlated variables during feature selection,和 features engneering?
回答列表
-
2019/11/04 下午 00:08Jeffrey贊同數:0不贊同數:0留言數:0
Hi, 同學,
EDA 會是需要的, 其他的項目要看DATASET 的特性, 比如說: 要使用 K-means, 就是看outlier, features engneering.
Thanks
-
2019/11/04 下午 05:42張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
呃,需不需要這件事情應該是看你的需求跟目的是什麼?Missing data 的處理是因為資料間需要計算距離,不管是 Unsupervised Learning 或是 Supervised Learning 都需要,feature selection 是從 Supervised 中挑選影響 y 欄位顯著的 X 欄位,可是 Unsupervised 其實沒有 X & y 之分。簡單來說,前期工作工作的範疇很大,每個動作都有不同的目的跟需求。
-
2019/11/04 下午 07:35William Mok贊同數:0不贊同數:0留言數:1
謝謝兩位老師