使用哪一種OneHotEncoder 較適合?
2019/05/24 下午 03:16
機器學習共學討論版
Vincent Chung
觀看數:11
回答數:2
收藏數:0
ml100-2-d22
ml100-2
為什麼不是用 sklearn的API? 也可以用這個做法嗎?
https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html
回答列表
-
2019/05/26 下午 09:05Seanyu.TW贊同數:1不贊同數:0留言數:0
Hi, 事實上兩者皆可,範例中提供使用 get_dummy 的方法只是其中一種解法而已。在未來的課程中你也會慢慢發現許多做法並非唯一,很常取決於使用者比較偏好哪一套而已,相信您未來也可以找到適合自己的方 :)
-
2019/05/27 上午 10:46張維元 (WeiYuan)贊同數:2不贊同數:0留言數:2
對哦,其實會發現 sklearn 跟 pandas 在資料前處理有蠻多內容重疊的,像是編碼或是補值都有。如同 Seanyu 專家講得取決於使用者比較偏好哪一套而已。
我自己的習慣是,通常 pandas 會提供比較彈性的調整,sklearn 的用法上會比較侷限。