logo
Loading...

週期循環特徵問題 - Cupoy

您好,我對於D27 有3個問題:1. 【週期循環特徵】df['day_cycle'] = df['p...

ml100-4,ml100-4-d27

週期循環特徵問題

2020/03/29 上午 02:51
機器學習共學討論版
李政澤
觀看數:17
回答數:6
收藏數:0
ml100-4
ml100-4-d27

您好,我對於D27 有3個問題:


1. 【週期循環特徵】

df['day_cycle'] = df['pickup_hour']/12 + df['pickup_minute']/720 + df['pickup_second']/43200

df['day_cycle'] = df['day_cycle'].map(lambda x:math.sin(x*math.pi))


以上程式可以解釋多一些嗎?背後邏輯是什麼?


2. 承上,為什麼日週期,會需要3個時間單位(小時,分鐘,秒),而年週期,只需2個(月,日),不加入星期?

df['day_cycle'] = df['pickup_hour']/12 + df['pickup_minute']/720 + df['pickup_second']/43200


df['year_cycle'] = df['pickup_month']/6 + df['pickup_day']/180


3. 【時段特徵】

。。。時段特徵則是會統計16:05-17:04 的點擊量量。。。

意思是只有real time data 才會用到?

一般的數據,會總結昨日數據,而昨日數據就24小時,

1小時。。1小時。。為1個單位



謝謝

回答列表

  • 2020/03/29 下午 08:31
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:1

    嗨,政澤,以下簡單回覆你的問題:


    1. 【週期循環特徵】


    => 這邊是想要把 pickup_hour、pickup_minute、pickup_second 統一成一個欄位,因此這邊是轉成「天」的單位。


    2. 承上,為什麼日週期,會需要3個時間單位(小時,分鐘,秒),而年週期,只需2個(月,日),不加入星期?


    => 日週期是以秒為單位,年週期是以天為單位。星期已經包含在日當中,因此不用額外加入。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/03/30 上午 00:13
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    嗨,「週期循環特徵」你想問的是哪一行?


    ```

    df['day_cycle'] = df['pickup_hour']/12 + df['pickup_minute']/720 + df['pickup_second']/43200

    df['day_cycle'] = df['day_cycle'].map(lambda x:math.sin(x*math.pi))

    ```


    你第一行可以理解了嗎?或是兩行都不懂?


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/03/30 上午 00:16
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:1

    3. 【時段特徵】

    。。。時段特徵則是會統計16:05-17:04 的點擊量量。。。

    意思是只有real time data 才會用到?

    一般的數據,會總結昨日數據,而昨日數據就24小時,

    1小時。。1小時。。為1個單位


    => 這個要看你的數據長怎樣,不同資料的精準度還有週期是不一樣的。舉個例子,如果我們收集每天流感的統計資料,可以一天一天看是沒有意義的,但是如果一個季節一個季節看,可能會發現某些季節會有高峰。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/04/03 上午 03:42
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    我對time series的理解都是一小時一小時為單位,一個季度(3個月為單位),都是一個整數  你的例子: 。。。如果我們收集每天流感的統計資料,可以一天一天看是沒有意義的。。。   我們把單位換成1個季度就可以了,不是嗎?


    所以,如果我們原始搜集的資料是天為單位的,意義可能不明顯,所以我們會需要把單位換成1個季度。那怎麼換呢?就是利用原始天的數據,用計算的方式轉換成季的單位。


    所以原文中的:df['day_cycle'] = df['pickup_hour']/12 + df['pickup_minute']/720 + df['pickup_second']/43200 => 其實就是把 pickup_hour、pickup_minute、pickup_second 轉換成天的單位。

  • 2020/04/03 上午 03:44
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:1

    講義提及的  ··· ⽉月週期與薪⽔水、繳費相關 ··· 不理解


    => 通常如果是薪水或是繳費(電費、水費)都是一個月繳一次,如果我們用天為單位收集資料,就會發現在每個月的特定日期會有薪水入帳,會有繳費的出帳,因此我們會說這些資料是有週期性。