logo
Loading...

畫ECDF的目的為何? - Cupoy

1.底下這幾行,在我電腦跑不出來如答案的圖形?# 檢視這些欄位的數值範圍for col in num...

ml100-2,ecdf,ml100-2-d06

畫ECDF的目的為何?

2019/04/28 下午 09:00
機器學習共學討論版
Richard
觀看數:11
回答數:3
收藏數:0
ml100-2
ecdf
ml100-2-d06

1.底下這幾行,在我電腦跑不出來如答案的圖形?

# 檢視這些欄位的數值範圍
for col in numeric_columns:
   app_train
.boxplot(col)
   plt
.show()

2.如何判斷是底下這三欄有問題?


# 從上面的圖檢查的結果,至少這三個欄位好像有點可疑?

# AMT_INCOME_TOTAL
# REGION_POPULATION_RELATIVE
# OBS_60_CNT_SOCIAL_CIRCLE


3.請問畫 Empirical Cumulative Density Plot (ECDF)的目的是什麼?有辦法從此圖看出什麼端倪?獲取什麼資訊嗎?如何判斷有異常的值呢?


謝謝

回答列表

  • 2019/04/28 下午 11:53
    張維元 (WeiYuan)
    贊同數:
    不贊同數:
    留言數:

    2.如何判斷是底下這三欄有問題?

     

    => 其實就是「1.底下這幾行,在我電腦跑不出來如答案的圖形?」所以覺得怪怪的

  • 2019/04/29 上午 10:13
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    3. 請問畫 Empirical Cumulative Density Plot (ECDF)的目的是什麼?有辦法從此圖看出什麼端倪?獲取什麼資訊嗎?如何判斷有異常的值呢?


    => 一般正常的 CDF  應該長這樣:


    如果當 CDF 畫起來長這樣表示圖表中有長得跟這樣的行為差很多的樣子,可能就是需要特別注意的:


  • 2019/04/30 上午 00:58
    Seanyu.TW
    贊同數:0
    不贊同數:0
    留言數:0

    請問有沒有先檢查過一些例外值是否去除呢? 通常畫出來不太一樣可能是某些值沒有清除掉唷。