logo
Loading...

連續時間序列資料的模型訓練以及泛化性問題 - Cupoy

當訓練資料為連續時間序列資料時, 可能資料時間間隔很短(例如機台各感測器的連續輸出)若要切割樣本時(...

連續時間序列資料的模型訓練以及泛化性問題

2020/12/15 下午 11:44
機器學習 A 咖共學計畫
Yu-jhang Su
觀看數:19
回答數:1
收藏數:0

當訓練資料為連續時間序列資料時, 可能資料時間間隔很短(例如機台各感測器的連續輸出) 若要切割樣本時(train vs test), 雖然有打亂樣本, 但由於相近間的數據資料相似度高 容易讓model從training set就學到test set 模型容易over fitting, 導致後來在應用時, model泛化性不足 一般遇到這種情況會如何去處理???

回答列表

  • 2020/12/16 下午 03:37
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:1

    嗨,你好
    那你的 train vs test 可能要拉長抽樣的 rate 或是盡可能 training 有更好的代表性,如果用多個不同時間點的資料?

    嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤我的 Facebook技術部落格 ,也會不定時的舉辦分享活動,一起來玩玩吧 ヽ(●´∀`●)ノ