logo
Loading...

直方圖問題 - Cupoy

想問一下在HW9中以這句開頭的這題:# 最大值落在分布之外print(app_train['REGI...

直方圖問題

2020/03/16 下午 07:06
機器學習共學討論版
吳盈昆
觀看數:7
回答數:2
收藏數:0

想問一下在HW9中以這句開頭的這題:# 最大值落在分布之外

print(app_train['REGION_POPULATION_RELATIVE'].describe())


app_train['REGION_POPULATION_RELATIVE'].value_counts() #這行不知道為什麼在執行value_counts運算後 出現最多次的值不是畫出hist圖後 最高的那個


0.035792 16408

0.046220 13442

0.030755 12163

0.025164 11950

0.026392 11601

最大的值應該要超過三萬才對不是嗎

謝謝!

回答列表

  • 2020/03/16 下午 10:15
    Gaprs
    贊同數:1
    不贊同數:0
    留言數:0

    因為直方圖 bins的關係

    你看到的直方圖超過三萬的是接近0.02這個值(包括接近值)的次數總和

    而你列出來看到的0.035792出現16408次,觀察直方圖在0.035附近就僅有一根柱代表這個值而已

  • 2020/03/17 上午 01:06
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    嗨,如同 Gaprs 所説, hist 會依照資料的大小做分組的行為,也許 0.035792  的數量很多,但他的組別整體累計下來並不一定是最多的。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃