logo
Loading...

histogram作圖出現問題 - Cupoy

請問為甚麼在 notebook 裡面會說以下三個比較可疑?1. AMT_INCOME_TOTAL2....

ml100,ml100-d09

histogram作圖出現問題

2020/06/03 上午 02:20
機器學習共學討論版
Yang Wang
觀看數:14
回答數:6
收藏數:0
ml100
ml100-d09

請問為甚麼在 notebook 裡面會說以下三個比較可疑?


1. AMT_INCOME_TOTAL

2. REGION_POPULATION_RELATIVE

3. OBS_60_CNT_SOCIAL_CIRCLE


畫出圖之後還是看不太出來。

回答列表

  • 2020/06/05 上午 00:33
    張維元 (WeiYuan)
    贊同數:2
    不贊同數:0
    留言數:0

    嗨,你是指作業的部分嗎?說明的地方有説:當 histogram 畫出上面這種圖 (只出現一條,但是 x 軸延伸很長導致右邊有一大片空白時,代表右邊有值但是數量稀少。這時可以考慮用 value_counts 去找到這些數值。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/06/05 上午 02:26
    Yang Wang
    贊同數:0
    不贊同數:0
    留言數:0

    我是這邊不太懂

    作業上說從上面的圖檢查的結果發現至少這三個欄位有點可疑,但是我上面沒有出現任何圖表。

  • 2020/06/10 上午 03:35
    Yang Wang
    贊同數:0
    不贊同數:0
    留言數:2

    有時候 Numbers of remain columns 會顯示非零的數字,有時候卻是出現零。

  • 2020/06/12 上午 05:57
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:1

    有時候 Numbers of remain columns 會顯示非零的數字,有時候卻是出現零。


    => 建議把 np.int 改用np.dtype('int') ,np.dtype('float') 看看,或是改成使用 select_dtypes 比較試試看。



    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃


    贊同 0


    留言

  • 2020/06/12 上午 05:57
    張維元 (WeiYuan)
    贊同數:2
    不贊同數:0
    留言數:0

    這邊補充說明一下,在 Numpy 中有幾種表示數值的欄位:


    1. int

    2. int64

    3. np.int64

    4. np.dtype('float64')


    當只用 int 的時候預設會等於你的電腦中最大的 int 數值,不同的電腦可能會有差異。另外 int64、np.int64、np.dtype('float64') 這三種寫法在用 == 比較的時候是等價的,但用 is/isin 判斷卻會錯。原因在於 is 是比較嚴格的物件比較,除了數值本身之外,也會比型態的差異。


    舉個例子,這三種 int64、np.int64、np.dtype('float64')  都可以表達 int64,但他們分別是字串、np.int64、和 np.dtype 型態,因此在用 isin 的時候會出錯。所以這邊建議大家改用 dtype_select 來處理,會比較容易。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃