logo
Loading...

有什麼方案可以每天遞迴的預測取得真實準確度? - Cupoy

每天都會對歷史資料和今天產生的資料作訓練產生模型,並且資料是有時間的性質的,但是目前訓練出來的準確度...

有什麼方案可以每天遞迴的預測取得真實準確度?

2021/11/21 下午 01:49
機器學習共學討論版
Ma Chao Ting
觀看數:22
回答數:2
收藏數:0

每天都會對歷史資料和今天產生的資料作訓練產生模型,並且資料是有時間的性質的, 但是目前訓練出來的準確度都是針對測試集的 想請問有沒有什麼方案 或功能 可以取得像這樣每天產模型預測的真實準確度呢?

回答列表

  • 2021/11/22 下午 01:57
    Wells Lu
    贊同數:0
    不贊同數:0
    留言數:0

    所謂在訓練過程中我們把資料區分成training跟testing data是只用training data建模型,然而testing data對模型來說是沒看過的、新的資料,就假設我用2010\~2020年的資料建出一個選股模型,那對於這個模型來講他只看過2020以前的數據,2021年的每一天數據對他來講都是新的每一筆,就像是在2020前的我們一樣沒看過2021年的數據,所以這時再用我們建好的模型去對2021的每一個新的一天做預測,再看此模型跟真實的結果的準確度,若準確度佳我們才會以此類推認為對於我們沒看過的2022年後的資料有好的準確度。 至於時間性的問題也是在建立模型時要設計的,譬如經過你的研究過後以一年為區段當input有最佳的結果,那麼2020/01/01\~2020/12/31就是預測2021/01/01然後2020/01/02~2021/01/01就是預測2021/01/02,後面以此類推。 如果上述是我誤會你想問的意思,你是想預測你預測的準確度的話,那我覺得你把預測集資料的準確度做信賴程度的統計應該就好了。

  • 2021/11/28 上午 11:27
    Ma Chao Ting
    贊同數:0
    不贊同數:0
    留言數:0

    使我目前用sklearn的train_test_split進行訓練集和測試集數據劃分後,數據的順序被打亂,不再按照日期排序 這時候預測的準確度高達80% 於是就對數據按照日期順序劃分訓練集和測試集,比如2015年之前的作為訓練集,之後的作為測試集。重新訓練後,預測準確度下降到了50% 但是我如果每天訓練一個模型預測一次 持續一個月 又可以達到60~70% 想請教像這樣的指數的資料 為什麼會有這個現象? 如果每天訓練一個模型預測一次 這樣的做法非常消耗資源,主要是想請問有沒有更好的做法?