groupby 問題
2019/09/30 下午 03:33
機器學習共學討論版
黃承鴻
觀看數:18
回答數:3
收藏數:0
day26
加上
你好我想請問一下在作業當中
# 加上 'Cabin' 欄位的計數編碼
count_df = df.groupby(['Cabin'])['Name'].agg({'Cabin_Count':'size'}).reset_index() 會產生正確的 Cabin 與其count ,而當少寫['Name']欄位
count_df = df.groupby(['Cabin']).agg({'Cabin_Count':'size'}).reset_index() 會產生錯誤結果,我的疑問是我們不就是要計算以Cabin的種類來計算他的數量嗎? 為何少寫了Name會錯或是為什麼加了Name才是對的
謝謝解答
回答列表
-
2019/10/01 上午 01:01張維元 (WeiYuan)贊同數:0不贊同數:0留言數:2
嗨,我記得之前有同學沒加是不會影響的,請問你這邊的錯誤是什麼?
-
2019/10/01 下午 01:25陳明佑 (Ming You Chen)贊同數:0不贊同數:0留言數:0
之前有 trace 過, 結果就是會造成問題, 所以才硬加上那個欄位
可能是有一些套件的版本不同所導致的
-
2019/10/01 下午 03:23張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
補充之前的討論在這裡:https://www.cupoy.com/qa/kwassist/ai_tw/0000016D6B087064000000396375706F795F72656C656173655155455354 ,我記得當時同學的意思是有沒有放,或是換成其他欄位結果都一樣。
@明佑 專家的意思這裡一定要放(或換成其他欄位),不然會有錯誤嗎?