logo
Loading...

AMT_INCOME_TOTAL欄位畫直方圖問題 - Cupoy

f_app_train = os.path.join(dir_data, 'application_...

直方圖

AMT_INCOME_TOTAL欄位畫直方圖問題

2020/06/13 02:42 PM
機器學習新手論壇
Mina
觀看數:0
回答數:3
收藏數:0
直方圖

f_app_train = os.path.join(dir_data, 'application_train.csv')

app_train = pd.read_csv(f_app_train)


app_train.head(1000).hist(column="AMT_INCOME_TOTAL",bins=100)

app_train.hist(column="AMT_INCOME_TOTAL",bins=100)

您好,想請問一下,我在畫 AMT_INCOME_TOTAL 這個欄位的時候,發現好像有些問題,

如上圖,只取前1000筆資料的時候,直方圖以較正常的方式呈現。

而當我取所有的資料,畫取直方圖時,圖形上看起來只剩一條線。


目前猜測可能是"該欄位的值"分布較廣的原因,想請問如果遇到這種狀況,要如何讓直方圖以較正常的方式顯示呢?


我自己有試了一下之前作業的 np.log1p 函式,看起來有比較正常(如下圖)。請問正常業界也是這樣處理資料的可視化嗎? 還是是否有其他方式可以解決呢?


test = np.log1p(app_train['AMT_INCOME_TOTAL'])

test.hist(bins=100)