logo
Loading...

資料中int64與flaot64的資料型態篩選問題 - Cupoy

# 先篩選數值型的欄位numeric_columns = list(app_train.column...

ml100,ml100-d09

資料中int64與flaot64的資料型態篩選問題

2020/06/10 08:38 AM
機器學習新手論壇
徐偉傑
觀看數:0
回答數:4
收藏數:0
ml100
ml100-d09

# 先篩選數值型的欄位
numeric_columns
= list(app_train.columns[list(app_train.dtypes.isin([np.int64, np.float64]))])

# 再把只有 2 值 (通常是 0,1) 的欄位去掉
numeric_columns
= list(app_train[numeric_columns].columns[list(app_train[numeric_columns].apply(lambda x:len(x.unique())!=2 ))])
print("Numbers of remain columns: %i" % len(numeric_columns))

# 檢視這些欄位的數值範圍
for col in numeric_columns:
   app_train
.boxplot(col)
   plt
.show()


Numbers of remain columns: 0

不太懂data裡的型態有int64與flaot64但這裡卻0

#----個人是用這種方式篩選的

numeric_columns = list(app_train.columns[list(app_train.dtypes == 'float64')])+list(app_train.columns[list(app_train.dtypes == 'int64')])

#----

最後這題解答沒有呈現

# 把一些極端值暫時去掉,在繪製一次 Histogram

# 選擇 OBS_60_CNT_SOCIAL_CIRCLE 小於 20 的資料點繪製


麻煩了~~