logo
Loading...

replace的使用方式 - Cupoy

不好意思,請教一下,在 Day 9 的 In [6]# 新增一個欄位: DAYS_EMPLOYED_...

ml100-3-d09

replace的使用方式

2019/09/29 12:19 AM
機器學習新手論壇
許義翔
觀看數:0
回答數:2
收藏數:0
ml100-3-d09

不好意思,請教一下,在 Day 9 的 In [6]

# 新增一個欄位: DAYS_EMPLOYED_ANOM 來標記 DAYS_EMPLOYED 是否異常
app_train['DAYS_EMPLOYED_ANOM'] = app_train["DAYS_EMPLOYED"] == 365243
print(app_train['DAYS_EMPLOYED_ANOM'].value_counts())

# 這邊我們用 nan 將異常值取代
app_train['DAYS_EMPLOYED'].replace({365243: np.nan}, inplace = True)

app_train['DAYS_EMPLOYED'].plot.hist(title = 'Days Employment Histogram');
plt.xlabel('Days Employment');

我知道 app_train['DAYS_EMPLOYED'] 指的是資料裡面的 DAYS_EMPLOYED 欄位,目的是想要將 裡面的 365243 替換成nan,我不理解的是為什麼要寫成 {365243: np.nan} 而不是 app_train['DAYS_EMPLOYED'].replace(365243, nan)


其中.replace({365243: np.nan}, inplace = True),這段的說明與我之前所學的Python replace()方法好像不太一樣。


1. 請問其中 {} 在這裡代表的意義是什麼呢?

2. 是否有網站有更進一步的說明或介紹呢?謝謝!