logo
Loading...

使用哪一種OneHotEncoder 較適合? - Cupoy

為什麼不是用 sklearn的API? 也可以用這個做法嗎?https://scikit-learn...

ml100-2-d22,ml100-2

使用哪一種OneHotEncoder 較適合?

2019/05/24 下午 03:16
機器學習共學討論版
Vincent Chung
觀看數:11
回答數:2
收藏數:0
ml100-2-d22
ml100-2

為什麼不是用 sklearn的API? 也可以用這個做法嗎?


https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html

回答列表

  • 2019/05/26 下午 09:05
    Seanyu.TW
    贊同數:1
    不贊同數:0
    留言數:0

    Hi, 事實上兩者皆可,範例中提供使用 get_dummy 的方法只是其中一種解法而已。在未來的課程中你也會慢慢發現許多做法並非唯一,很常取決於使用者比較偏好哪一套而已,相信您未來也可以找到適合自己的方 :)

  • 2019/05/27 上午 10:46
    張維元 (WeiYuan)
    贊同數:2
    不贊同數:0
    留言數:2

    對哦,其實會發現 sklearn 跟 pandas 在資料前處理有蠻多內容重疊的,像是編碼或是補值都有。如同 Seanyu 專家講得取決於使用者比較偏好哪一套而已。


    我自己的習慣是,通常 pandas 會提供比較彈性的調整,sklearn 的用法上會比較侷限。