ECDF與np.log的問題?
在範例程式中
plt.plot(np.log(list(cdf['OBS_60_CNT_SOCIAL_CIRCLE'].index)), cdf['OBS_60_CNT_SOCIAL_CIRCLE']/cdf['OBS_60_CNT_SOCIAL_CIRCLE'].max())
plt.xlabel('Value (log-scale)')
plt.ylabel('ECDF')
# plt.ylim([-0.05,1.05]) # 限制顯示圖片的範圍
plt.show()
在其中一個步驟
plt.plot(np.log(list(cdf['OBS_60_CNT_SOCIAL_CIRCLE'].index)), cdf['OBS_60_CNT_SOCIAL_CIRCLE']/cdf['OBS_60_CNT_SOCIAL_CIRCLE'].max())
為什麼需把index做np.log,這樣畫出來的圖帶鰾什麼意義?
google之後發現np.log為取對數的意思,請問取對數是為了什麼?
且為什麼要使用np.log?
回答列表
-
2019/09/07 下午 09:14張維元 (WeiYuan)贊同數:0不贊同數:0留言數:1
嗨,可以參考一下我之前回復過的答案:https://www.cupoy.com/qa/kwassist/ai_tw/0000016CF6E51E170000007D6375706F795F72656C656173655155455354
看完後,你覺得這一題使用的原因是什麼呢?
第二個問題,為什麼要使用np.log? 因為他是 series 的資料啊,不然要用什麼?
-
2019/09/08 下午 03:02張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
感謝你的回答 我看完你貼給我的連結之後 我覺得是 用log將樣本數量的數值範圍縮小,這樣在做圖之後就更加突顯了這份資料的分布,因為這樣才會使用log 不知道這樣理解對不對?
=> 對,你的理解是對的!這邊主要用於方便觀察:)