Loading...

replace的使用方式 - Cupoy

不好意思，請教一下，在 Day 9 的 In [6]# 新增一個欄位: DAYS_EMPLOYED_...

ml100-3-d09

replace的使用方式

2019/09/29 上午 08:19

機器學習共學討論版

許義翔

觀看數：48

回答數：2

收藏數：0

ml100-3-d09

不好意思，請教一下，在 Day 9 的 In [6]

# 新增一個欄位: DAYS_EMPLOYED_ANOM 來標記 DAYS_EMPLOYED 是否異常
app_train['DAYS_EMPLOYED_ANOM'] = app_train["DAYS_EMPLOYED"] == 365243
print(app_train['DAYS_EMPLOYED_ANOM'].value_counts())

# 這邊我們用 nan 將異常值取代
app_train['DAYS_EMPLOYED'].replace({365243: np.nan}, inplace = True)

app_train['DAYS_EMPLOYED'].plot.hist(title = 'Days Employment Histogram');
plt.xlabel('Days Employment');

# 新增一個欄位: DAYS_EMPLOYED_ANOM 來標記 DAYS_EMPLOYED 是否異常
app_train['DAYS_EMPLOYED_ANOM'] = app_train["DAYS_EMPLOYED"] == 365243
print(app_train['DAYS_EMPLOYED_ANOM'].value_counts())

# 這邊我們用 nan 將異常值取代
app_train['DAYS_EMPLOYED'].replace({365243: np.nan}, inplace = True)

app_train['DAYS_EMPLOYED'].plot.hist(title = 'Days Employment Histogram');
plt.xlabel('Days Employment');

我知道 app_train['DAYS_EMPLOYED'] 指的是資料裡面的 DAYS_EMPLOYED 欄位，目的是想要將裡面的 365243 替換成nan，我不理解的是為什麼要寫成 {365243: np.nan} 而不是 app_train['DAYS_EMPLOYED'].replace(365243, nan)

其中.replace({365243: np.nan}, inplace = True)，這段的說明與我之前所學的Python replace()方法好像不太一樣。

1. 請問其中 {} 在這裡代表的意義是什麼呢？

2. 是否有網站有更進一步的說明或介紹呢？謝謝！

回答列表

2019/09/29 下午 02:14

許義翔

贊同數：0

不贊同數：0

留言數：0

找到答案了，謝謝！

https://bit.ly/2mJFSHT
2019/09/30 上午 00:23

張維元 (WeiYuan)

贊同數：0

不贊同數：0

留言數：0

因為真的跟你以前用的 Python replace 不一樣，這是 df 的 replace：https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.replace.html