logo
Loading...

正式上線時測試集準確度很差的應對處理方式 - Cupoy

當利用訓練集以及驗證集資料,做出一個機器學習Model後,假設其驗證集的準確度很不錯(亦有交叉驗證過...

正式上線時測試集準確度很差的應對處理方式

2021/04/06 下午 02:20
機器學習 - 流程與步驟
Yaoga
觀看數:130
回答數:2
收藏數:2

當利用訓練集以及驗證集資料,做出一個機器學習Model後,假設其驗證集的準確度很不錯(亦有交叉驗證過),當正式上線,利用測試集來做預測時,反而效果很差,這就是所謂的過度擬合的情況嗎?遇到這種問題時該如何處理?

回答列表

  • 2021/04/06 下午 02:35
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    嗨,你好
    聽起來不像是「過度擬合」的現象,過度擬合通常是指對「特定的訓練資料很準,但驗證集不準」的情況下,而且你還有交叉驗證。會建議你先檢查一下正式上線收集的測試集,跟你原本的訓練資料是不是差很多?

    嗨,你好,我是維元,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流,都可以追蹤 我的粉絲專頁 ヽ(●´∀`●)ノ

  • 2021/04/06 下午 02:56
    Yaoga
    贊同數:0
    不贊同數:0
    留言數:2

    您好,討論回覆如下: 1.所以過擬合的定義算是訓練集資料很準驗證集不準這樣才算是過度擬合是嗎? 2.但測試集資料偏屬同一批資料源出來的,應該差異不會太大,如果遇到這種問題會不會有可能是訓練驗證集的資料前處理時,測試集也未一同進相同的方式做前處理才會發生這種問題呢?