logo
Loading...

X有上百個,但每次只放前50個重要變數進行訓練,如何預訓練分類模型? - Cupoy

我的資料集中X固定有300多個,Y只有1個(0或1),數據約有20~800萬筆不等;會先將300多個...

X有上百個,但每次只放前50個重要變數進行訓練,如何預訓練分類模型?

2022/11/30 上午 09:55
機器學習共學討論版
魏敬玲
觀看數:8
回答數:1
收藏數:0

我的資料集中X固定有300多個,Y只有1個(0或1),數據約有20~800萬筆不等; 會先將300多個X都做Label Encoding,並使用機器學習百日馬拉松DAY49中的Blending模型進行分類預測, 因為數據量大,又使用了3+1個模型,所以每次只會特徵提取出前50個重要特徵進行模型訓練。 但因為每次重要特徵都不同,導致每當有新數據時就必須重新訓練模型, 是否有辦法固定模型,X固定50個,Y固定1個,每次數據都只需predict就好,不用重新fit?

回答列表

  • 2022/12/01 下午 03:02
    王健安
    贊同數:0
    不贊同數:0
    留言數:0

    魏敬玲 您好, 有以下數種方法讓你每次訓練出來的模型可以相似, 1. 每次訓練後把模型存下來,這樣一來下次要預測就可以直接呼叫模型檔案做預測 2. 將每一次切割訓練、驗證與測試資料的組合固定下來,這樣就可以避免掉因資料本身差異造成訓練結果不同。 3. 若實驗多次後確定某些變數對模型預測力不會有好的效果,訓練時就直接排除它,減少模型的變異。