刪除有遺失值的列用drop或是dropna均無效?
因為老師的題目中有提到要刪除遺失值,所以我使用兩種方法試過都無效: 1. 先用drop,再用loc的方式除去指定欄位有缺失值的資料 df.drop(df.loc[df['Sex']=='NaN'].index, inplace=True) df.drop(df.loc[df['Age']=='NaN'].index, inplace=True) df.drop(df.loc[df['Pclass']=='NaN'].index, inplace=True) 2. 因為發現處理後第888列在Age欄位中還是有顯示NaN的資料缺失的欄位,所以決定再用dropna將任何資料中有缺失的行都刪除 df.dropna(axis=0, how='any') 但是第888行在Age的部分還是存在 網路上看到都是下這些參數去處理缺失值,請問老師我是否有用法上的問題呢?
回答列表
-
2021/02/28 上午 00:47張維元 (WeiYuan)贊同數:0不贊同數:0留言數:1
嗨,你好
關於第一個問題,為什麼不直接使用 dropna 就好了?第二個問題是你要把 drop 後的結果存回去: ``` df = df.dropna(axis=0, how='any') ```
嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤我的 Facebook 或 技術部落格 ,也會不定時的舉辦分享活動,一起來玩玩吧 ヽ(●´∀`●)ノ 以下分享一些我近期發表跟資料科學有關的文章,歡迎大家持續追蹤: ■ 資料分析工具那麼多,該怎麼選? 🛠️
■ 真.資料團隊與分工
■ 觀察資料的 N 件事 🔖
■ 資料前處理必須要做的事 - 資料清理與型態調整