ecdf畫圖問題
2019/09/05 下午 08:20
機器學習共學討論版
廖柏鈞
觀看數:52
回答數:2
收藏數:0
ml100-3-d9
ml100-3
在繪製ecdf有看到有些人答案是用sm.distributions.ECDF繪製的
但匯出的結果是鋸齒狀的,和解答不一樣,想問這兩張都可以嗎,還是有差
方法一用
cdf = app_train['REGION_POPULATION_RELATIVE'].value_counts().sort_index().cumsum()的REGION_POPULATION_RELATIVE圖長這樣
但如果用方法2
cdf = sm.distributions.ECDF(app_train['REGION_POPULATION_RELATIVE'])繪製的方式
(以https://github.com/ghostpink0307/3rd-ML100Days/blob/master/homework/Day_009_HW.ipynb 為例)
長這樣:
回答列表
-
2019/09/05 下午 09:04張維元 (WeiYuan)贊同數:1不贊同數:0留言數:1
嗨,ecdf 應該有鋸齒狀是正常的哦!所謂的 ecdf 就是指真實資料的 cdf,cdf 是理想狀況。可以參考這張圖:
reference: https://stats.stackexchange.com/questions/239937/empirical-cdf-vs-cdf
另外,「但匯出的結果是鋸齒狀的,和解答不一樣,想問這兩張都可以嗎,還是有差」可以把兩張都貼上來嗎?
-
2019/09/06 下午 10:22張維元 (WeiYuan)贊同數:1不贊同數:0留言數:2
「你好 我已經將兩張圖貼上來了 請問這兩張圖是一樣意思嗎 解答的平滑許多 用statsmodel的有鋸齒狀」
=> 是一樣的,因為還是有鋸齒狀啊,只是少許計算上有差異而已,大致上可以視為相同。差異應該是計算 x 軸的精度不一樣。