replace的使用方式
2019/09/29 上午 08:19
機器學習共學討論版
許義翔
觀看數:48
回答數:2
收藏數:0
ml100-3-d09
不好意思,請教一下,在 Day 9 的 In [6]
# 新增一個欄位: DAYS_EMPLOYED_ANOM 來標記 DAYS_EMPLOYED 是否異常
app_train['DAYS_EMPLOYED_ANOM'] = app_train["DAYS_EMPLOYED"] == 365243
print(app_train['DAYS_EMPLOYED_ANOM'].value_counts())
# 這邊我們用 nan 將異常值取代
app_train['DAYS_EMPLOYED'].replace({365243: np.nan}, inplace = True)
app_train['DAYS_EMPLOYED'].plot.hist(title = 'Days Employment Histogram');
plt.xlabel('Days Employment');
我知道 app_train['DAYS_EMPLOYED'] 指的是資料裡面的 DAYS_EMPLOYED 欄位,目的是想要將 裡面的 365243 替換成nan,我不理解的是為什麼要寫成 {365243: np.nan} 而不是 app_train['DAYS_EMPLOYED'].replace(365243, nan)
其中.replace({365243: np.nan}, inplace = True),這段的說明與我之前所學的Python replace()方法好像不太一樣。
1. 請問其中 {} 在這裡代表的意義是什麼呢?
2. 是否有網站有更進一步的說明或介紹呢?謝謝!
回答列表
-
2019/09/29 下午 02:14許義翔贊同數:0不贊同數:0留言數:0
找到答案了,謝謝!
-
2019/09/30 上午 00:23張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
因為真的跟你以前用的 Python replace 不一樣,這是 df 的 replace:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.replace.html