Loading...

X有上百個，但每次只放前50個重要變數進行訓練，如何預訓練分類模型？ - Cupoy

我的資料集中X固定有300多個，Y只有1個(0或1)，數據約有20~800萬筆不等；會先將300多個...

AI共學社群

X有上百個，但每次只放前50個重要變數進行訓練，如何預訓練分類模型？

2022/11/30 上午 09:55

機器學習共學討論版

魏敬玲

觀看數：12

回答數：1

收藏數：0

我的資料集中X固定有300多個，Y只有1個(0或1)，數據約有20~800萬筆不等；會先將300多個X都做Label Encoding，並使用機器學習百日馬拉松DAY49中的Blending模型進行分類預測，因為數據量大，又使用了3+1個模型，所以每次只會特徵提取出前50個重要特徵進行模型訓練。但因為每次重要特徵都不同，導致每當有新數據時就必須重新訓練模型，是否有辦法固定模型，X固定50個，Y固定1個，每次數據都只需predict就好，不用重新fit?

回答列表

2022/12/01 下午 03:02

王健安

贊同數：0

不贊同數：0

留言數：0

魏敬玲您好，有以下數種方法讓你每次訓練出來的模型可以相似， 1. 每次訓練後把模型存下來，這樣一來下次要預測就可以直接呼叫模型檔案做預測 2. 將每一次切割訓練、驗證與測試資料的組合固定下來，這樣就可以避免掉因資料本身差異造成訓練結果不同。 3. 若實驗多次後確定某些變數對模型預測力不會有好的效果，訓練時就直接排除它，減少模型的變異。