畫ECDF的目的為何?
2019/04/28 下午 09:00
機器學習共學討論版
Richard
觀看數:11
回答數:3
收藏數:0
ml100-2
ecdf
ml100-2-d06
1.底下這幾行,在我電腦跑不出來如答案的圖形?
# 檢視這些欄位的數值範圍
for
col
in
numeric_columns
:
app_train.
boxplot
(
col
)
plt.
show
()
2.如何判斷是底下這三欄有問題?
# 從上面的圖檢查的結果,至少這三個欄位好像有點可疑?
# AMT_INCOME_TOTAL
# REGION_POPULATION_RELATIVE
# OBS_60_CNT_SOCIAL_CIRCLE
3.請問畫 Empirical Cumulative Density Plot (ECDF)的目的是什麼?有辦法從此圖看出什麼端倪?獲取什麼資訊嗎?如何判斷有異常的值呢?
謝謝
回答列表
-
2019/04/28 下午 11:53張維元 (WeiYuan)贊同數:不贊同數:留言數:
2.如何判斷是底下這三欄有問題?
=> 其實就是「1.底下這幾行,在我電腦跑不出來如答案的圖形?」所以覺得怪怪的
-
2019/04/29 上午 10:13張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
3. 請問畫 Empirical Cumulative Density Plot (ECDF)的目的是什麼?有辦法從此圖看出什麼端倪?獲取什麼資訊嗎?如何判斷有異常的值呢?
=> 一般正常的 CDF 應該長這樣:
如果當 CDF 畫起來長這樣表示圖表中有長得跟這樣的行為差很多的樣子,可能就是需要特別注意的:
-
2019/04/30 上午 00:58Seanyu.TW贊同數:0不贊同數:0留言數:0
請問有沒有先檢查過一些例外值是否去除呢? 通常畫出來不太一樣可能是某些值沒有清除掉唷。