Day_004_column_data_type
2019/05/01 上午 01:19
機器學習共學討論版
陳昱叡
觀看數:8
回答數:3
收藏數:0
ml100-2
語法
ml100-2-d04
請問
1.app_train.select_dtypes(include=["object"]).apply(pd.Series.nunique, axis = 0) 為何要做這一步驟
2.
如果說那一行的分類方式為object 且 只小於等於兩類的話,那下面的CODE_GENDER欄位部分為什麼沒有變動?
不也是['M','F'],還是其實有三個?
回答列表
-
2019/05/01 下午 00:17張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
1.app_train.select_dtypes(include=["object"]).apply(pd.Series.nunique, axis = 0) 為何要做這一步驟
=> 檢視資料中類別型欄位各自類別的數量,先看一下每一個欄位分別有多少相異的值
-
2019/05/01 下午 00:24張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
2. 如果說那一行的分類方式為object 且 只小於等於兩類的話,那下面的CODE_GENDER欄位部分為什麼沒有變動?
不也是['M','F'],還是其實有三個?
=> 其實他是有三種值沒錯
-
2019/05/01 下午 04:25Seanyu.TW贊同數:0不贊同數:0留言數:0
這邊的意思是說,選取欄位 (資料型態包含 object) 之後,將這個新的 object 後接續一個計算: nunique, 也就是算這個欄位中有幾種獨特值 (非重複值) 的意思