pd.concat 問題
2019/10/17 下午 04:24
機器學習共學討論版
劉 彥廷
觀看數:21
回答數:3
收藏數:0
ml100-3-d26
各位專家好,
我用pd.concat進行資料合併後,發現合併後資料皆為NAN,有上網查過相關討論可能為index不同造成,但可以看到這邊index與資料維度都可以對上的,但不知道為什麼合併後為NAN,感謝各位專家解答!!
回答列表
-
2019/10/17 下午 10:36張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
語法上看起來是對的,不過結果好像怪怪的。為什麼你下面印出來的 df_count 跟上面的 df_all 前五筆不同,感覺是哪裡沒對上?
你要不要改用 join 的方式試試看?可以參考這一篇:https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html
-
2019/10/18 上午 10:46陳明佑 (Ming You Chen)贊同數:2不贊同數:0留言數:0
應該是你弄錯了 concat 的預設語法
pd.concat 預設的 axis 為 0, 也就是上下靠在一起
但你應該要的是由右邊靠過來, 也就是加上 axis=1 才會正確
你可以試著改印 df_all.tail()
應該會看到只有 Cabin_Hash 有值的情況 (其他column都 NaN)
-
2019/10/18 下午 00:01張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
想補充問一下:concat(axis=1) 跟 join 跟 merge 三者怎麼分?