出現cannot reindex from a duplicate axis錯誤
2019/06/15 下午 02:43
機器學習共學討論版
尹昱翰
觀看數:13
回答數:2
收藏數:0
ml100-2-d24
ml100-2
我再做 Cabin hash的時候 會一直出現下列的問題
但是找不太出來為什麼會發生這樣的情況
因為我有用shape去看過 他的row筆數是一樣
但是單純的使用
df['Cabin'].map(lambda x: hash(x)%3) 這樣的function後 跑出來的index只有483個 想知道為何會發生這樣的狀況
ValueError: cannot reindex from a duplicate axis
回答列表
-
2019/06/17 上午 10:52陳明佑 (Ming You Chen)贊同數:不贊同數:留言數:
會出現 cannot reindex from a duplicate axis, 表示 index 有重複
這個問題應該出現在前面某一行, 做了 concate 的時候沒有 reset_index
所以解法是這一區塊開始前先把資料表 reset_index 就好了
假如是df, 語法是 df=df.reset_index(drop=True)
-
2019/06/18 上午 11:54張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
除了 reset 之外,也可以用 .index 重新給值:
```
df.index = range(len(df))
```