直方圖問題
2020/03/16 下午 07:06
機器學習共學討論版
吳盈昆
觀看數:7
回答數:2
收藏數:0
想問一下在HW9中以這句開頭的這題:# 最大值落在分布之外
print(app_train['REGION_POPULATION_RELATIVE'].describe())
app_train['REGION_POPULATION_RELATIVE'].value_counts() #這行不知道為什麼在執行value_counts運算後 出現最多次的值不是畫出hist圖後 最高的那個
0.035792 16408
0.046220 13442
0.030755 12163
0.025164 11950
0.026392 11601
最大的值應該要超過三萬才對不是嗎
謝謝!
回答列表
-
2020/03/16 下午 10:15Gaprs贊同數:1不贊同數:0留言數:0
因為直方圖 bins的關係
你看到的直方圖超過三萬的是接近0.02這個值(包括接近值)的次數總和
而你列出來看到的0.035792出現16408次,觀察直方圖在0.035附近就僅有一根柱代表這個值而已
-
2020/03/17 上午 01:06張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
嗨,如同 Gaprs 所説, hist 會依照資料的大小做分組的行為,也許 0.035792 的數量很多,但他的組別整體累計下來並不一定是最多的。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃