logo
Loading...

ECDF與np.log的問題? - Cupoy

在範例程式中plt.plot(np.log(list(cdf['OBS_60_CNT_SOCIAL_...

ml100-3,ml100-3-d09

ECDF與np.log的問題?

2019/09/07 下午 03:07
機器學習共學討論版
Ma Chao Ting
觀看數:97
回答數:2
收藏數:0
ml100-3
ml100-3-d09

在範例程式中

plt.plot(np.log(list(cdf['OBS_60_CNT_SOCIAL_CIRCLE'].index)), cdf['OBS_60_CNT_SOCIAL_CIRCLE']/cdf['OBS_60_CNT_SOCIAL_CIRCLE'].max())

plt.xlabel('Value (log-scale)')

plt.ylabel('ECDF')


# plt.ylim([-0.05,1.05]) # 限制顯示圖片的範圍

plt.show()


在其中一個步驟

plt.plot(np.log(list(cdf['OBS_60_CNT_SOCIAL_CIRCLE'].index)), cdf['OBS_60_CNT_SOCIAL_CIRCLE']/cdf['OBS_60_CNT_SOCIAL_CIRCLE'].max())

為什麼需把index做np.log,這樣畫出來的圖帶鰾什麼意義?

google之後發現np.log為取對數的意思,請問取對數是為了什麼?

且為什麼要使用np.log? 

回答列表

  • 2019/09/07 下午 09:14
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:1

    嗨,可以參考一下我之前回復過的答案:https://www.cupoy.com/qa/kwassist/ai_tw/0000016CF6E51E170000007D6375706F795F72656C656173655155455354


    看完後,你覺得這一題使用的原因是什麼呢?


    第二個問題,為什麼要使用np.log? 因為他是 series 的資料啊,不然要用什麼?

  • 2019/09/08 下午 03:02
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    感謝你的回答 我看完你貼給我的連結之後 我覺得是  用log將樣本數量的數值範圍縮小,這樣在做圖之後就更加突顯了這份資料的分布,因為這樣才會使用log 不知道這樣理解對不對?


    => 對,你的理解是對的!這邊主要用於方便觀察:)