請問當訓練好的模型儲存後,使用其他資料集套用以訓練好的模型,結果準確率變差
2022/11/05 下午 04:18
機器學習百日馬拉松
Ju-Yi Hsu
觀看數:16
回答數:1
收藏數:1
請問當訓練好的模型儲存後(準確率90%以上),使用其他資料集套用已訓練好的模型,結果準確率變差。 請問這樣的問題要如何解決呢??
回答列表
-
2022/11/07 下午 03:10王健安贊同數:0不贊同數:0留言數:0
Ju-Yi Hsu 您好, 首先需要確認「訓練模型用的資料集」以及「要拿來預測的其他資料集」的特徵是否一致, 若不一致是無法直接套用進行預測的, 因為在數值範圍、連續或類別變數的定義不一定一樣; 若是一致的, 則接著可檢查兩個資料集相同特徵的資料分布是否一致, 可善用 Student's t-test、Chi-square test 等統計領域常用的假設檢定, 若檢定結果發現大部分特徵在兩個資料集之間沒有顯著差異, 代表兩個資料集的數值範圍、資料分布是相似的, 那就要回頭檢查在模型訓練過程中是否有發生 Overfitting 的問題; 若檢定結果發現大部分特徵在兩個資料集之間是有顯著差異的, 代表兩個資料集的樣本差異大, 表示訓練模型用的資料不夠多樣性, 導致模型也無法訓練到多樣性大的規律, 除了增加樣本數外,可善用 Ensemble Learning 增加模型的多樣性。