logo
Loading...

Day_004_column_data_type - Cupoy

請問1.app_train.select_dtypes(include=["object"]).ap...

ml100-2,語法,ml100-2-d04

Day_004_column_data_type

2019/05/01 上午 01:19
機器學習共學討論版
陳昱叡
觀看數:8
回答數:3
收藏數:0
ml100-2
語法
ml100-2-d04

請問

1.app_train.select_dtypes(include=["object"]).apply(pd.Series.nunique, axis = 0)  為何要做這一步驟

2.

如果說那一行的分類方式為object 且 只小於等於兩類的話,那下面的CODE_GENDER欄位部分為什麼沒有變動?

不也是['M','F'],還是其實有三個?

回答列表

  • 2019/05/01 下午 00:17
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    1.app_train.select_dtypes(include=["object"]).apply(pd.Series.nunique, axis = 0)  為何要做這一步驟


    => 檢視資料中類別型欄位各自類別的數量,先看一下每一個欄位分別有多少相異的值

  • 2019/05/01 下午 00:24
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    2. 如果說那一行的分類方式為object 且 只小於等於兩類的話,那下面的CODE_GENDER欄位部分為什麼沒有變動?

    不也是['M','F'],還是其實有三個?


    => 其實他是有三種值沒錯


  • 2019/05/01 下午 04:25
    Seanyu.TW
    贊同數:0
    不贊同數:0
    留言數:0

    這邊的意思是說,選取欄位 (資料型態包含 object) 之後,將這個新的 object 後接續一個計算: nunique, 也就是算這個欄位中有幾種獨特值 (非重複值) 的意思