執行雜湊程式出現cannot reindex from a duplicate axis
2019/05/19 08:31 下午
機器學習共學討論版
JS
觀看數:1
回答數:1
收藏數:0
ml100-2
day_024_hw
雜湊編碼
您好請問,在執行雜湊程式的過程如下:
若只是先整理df到「只取類別值 (object) 型欄位」的步驟,直接跑下段的程式會出現 ValueError
但是若調整成在前面先加上這一段:
就又能順利進行剛剛的雜湊了
看不懂 cannot reindex from a duplicate axis 的意思,比較前後做成的df好像只有差在後者多一欄Cabin的計數編碼Cabin_Count,但Cabin本身應該沒有差別吧?
那這是否意味著在進行雜湊編碼或均值編碼前,要先執行計數編碼呢?