logo
Loading...

出現cannot reindex from a duplicate axis錯誤 - Cupoy

我再做 Cabin hash的時候 會一直出現下列的問題 但是找不太出來為什麼會發生這樣的情況 因為...

ml100-2-d24,ml100-2

出現cannot reindex from a duplicate axis錯誤

2019/06/15 下午 02:43
機器學習共學討論版
尹昱翰
觀看數:13
回答數:2
收藏數:0
ml100-2-d24
ml100-2

我再做 Cabin hash的時候 會一直出現下列的問題 

但是找不太出來為什麼會發生這樣的情況 

因為我有用shape去看過 他的row筆數是一樣

但是單純的使用

df['Cabin'].map(lambda x: hash(x)%3) 這樣的function後 跑出來的index只有483個 想知道為何會發生這樣的狀況



ValueError: cannot reindex from a duplicate axis

回答列表

  • 2019/06/17 上午 10:52
    陳明佑 (Ming You Chen)
    贊同數:
    不贊同數:
    留言數:

    會出現 cannot reindex from a duplicate axis, 表示 index 有重複

    這個問題應該出現在前面某一行, 做了 concate 的時候沒有 reset_index


    所以解法是這一區塊開始前先把資料表 reset_index 就好了

    假如是df, 語法是 df=df.reset_index(drop=True)

  • 2019/06/18 上午 11:54
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    除了 reset 之外,也可以用 .index 重新給值:


    ```

    df.index = range(len(df))

    ```