Loading...

Day_004_column_data_type - Cupoy

請問1.app_train.select_dtypes(include=["object"]).ap...

ml100-2,語法,ml100-2-d04

AI共學社群

Day_004_column_data_type

2019/05/01 上午 01:19

機器學習共學討論版

陳昱叡

觀看數：8

回答數：3

收藏數：0

ml100-2

語法

ml100-2-d04

請問

1.app_train.select_dtypes(include=["object"]).apply(pd.Series.nunique, axis = 0) 為何要做這一步驟

2.

如果說那一行的分類方式為object 且只小於等於兩類的話，那下面的CODE_GENDER欄位部分為什麼沒有變動?

不也是['M','F']，還是其實有三個?

回答列表

2019/05/01 下午 00:17

張維元 (WeiYuan)

贊同數：0

不贊同數：0

留言數：0

1.app_train.select_dtypes(include=["object"]).apply(pd.Series.nunique, axis = 0) 為何要做這一步驟

=> 檢視資料中類別型欄位各自類別的數量，先看一下每一個欄位分別有多少相異的值
2019/05/01 下午 00:24

張維元 (WeiYuan)

贊同數：0

不贊同數：0

留言數：0

2. 如果說那一行的分類方式為object 且只小於等於兩類的話，那下面的CODE_GENDER欄位部分為什麼沒有變動?

不也是['M','F']，還是其實有三個?

=> 其實他是有三種值沒錯
2019/05/01 下午 04:25

Seanyu.TW

贊同數：0

不贊同數：0

留言數：0

這邊的意思是說，選取欄位 (資料型態包含 object) 之後，將這個新的 object 後接續一個計算: nunique, 也就是算這個欄位中有幾種獨特值 (非重複值) 的意思