logo
Loading...

Day009作業中的程式碼拆解後的多個問題 - Cupoy

1.include挑選資料類別, 網路上找到的用法是用中括號, 但自己嘗試用小括號也可以挑選成功, ...

day009

Day009作業中的程式碼拆解後的多個問題

2020/08/04 下午 06:04
機器學習共學討論版
AmberC.
觀看數:9
回答數:2
收藏數:1
day009

1.include挑選資料類別, 網路上找到的用法是用中括號, 但自己嘗試用小括號也可以挑選成功, 請問二者是否有差異?

include = ['int64', 'float64']

include = ('int64', 'float64')

----- 

2.用select_dtypes明明有選到需要的資料(如問題1的附圖), 但用isin卻變成False, 是因為isin只適用於list型態嗎?

-----

3.作業中的程式碼如下

numeric_columns = list(app_train.columns[list(app_train.dtypes.isin(dtype_select))])

其中

list(app_train.columns[list(app_train.dtypes.isin(dtype_select3))]), 第二個list有無寫入, 結果都一樣, 是否代表二者意義相同, 只是寫法不同呢?

-----

4.作業中的程式碼如下

numeric_columns = list(app_train[numeric_columns].columns[list(app_train[numeric_columns].apply(lambda x:len(x.unique())!=2 ))])

其中

list(app_train[numeric_columns])與

list(numeric_columns) 結果相同, 

作業中的程式碼用list(app_train[numeric_columns])是否與問題3一樣, 意義相同只是寫法不同呢?

-----

5. 作業上的註解如下

『# 從上面的圖檢查的結果,至少這三個欄位好像有點可疑

# AMT_INCOME_TOTAL

# REGION_POPULATION_RELATIVE

# OBS_60_CNT_SOCIAL_CIRCLE』

但其餘未提到的欄位:

# DAYS_EMPLOYE

# OBS_30_CNT_SOCIAL_CIRCLE

# DEF_30_CNT_SOCIAK_CIRCLE

# DEF_60_CNT_SOCIAK_CIRCLE

# AMT_REQ_CREDIT_BUREAY_QRT

上述欄位由下列的盒鬚圖判斷應該也算有極端值吧?


----------

請各位大神幫忙解惑, 謝謝。

回答列表

  • 2020/08/10 下午 05:37
    CUPOY
    贊同數:0
    不贊同數:1
    留言數:0

    哈囉~親愛的同學好


    已將您的提問通知專家了~還請再等候一下回覆,非常感謝!

  • 2020/08/10 下午 06:35
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:3

    嗨,關於你這種有多個小問題的問題,建議分開發問哦!


    1.「include挑選資料類別, 網路上找到的用法是用中括號, 但自己嘗試用小括號也可以挑選成功, 請問二者是否有差異?」


    => 在 Numpy 有四種不同的形態表示方法:


    1. int

    2. int64

    3. np.int64

    4. np.dtype('float64')


    當只用 int 的時候預設會等於你的電腦中最大的 int 數值,不同的電腦可能會有差異。另外 int64、np.int64、np.dtype('float64') 這三種寫法在用 == 比較的時候是等價的,但用 is/isin 判斷卻會錯。原因在於 is 是比較嚴格的物件比較,除了數值本身之外,也會比型態的差異。


    舉個例子,這三種 int64、np.int64、np.dtype('float64')  都可以表達 int64,但他們分別是字串、np.int64、和 np.dtype 型態,因此在用 isin 的時候會出錯。所以這邊建議大家改用 dtype_select 來處理,會比較容易。


    如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕,也可以追蹤我的GITHUB 帳號。若還有問題的話,也歡迎再開一個新的問題繼續發問,或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個社群活動:學員限定!CUPOY 馬拉松線上小聚 👨🏻‍💻👨🏻‍💻,歡迎一起來玩玩!