資料切割與測試結果問題?
2019/10/24 下午 08:52
機器學習共學討論版
林冠廷
觀看數:122
回答數:2
收藏數:0
ml100-3
ml100-3-d51
本次資料量非常小,在自行切分training/validation/testing set時就變得更小了,導致預測結果很取決於一開始切分的隨機性,我有將True/False兩部分分開切分,但上傳分數結果經常還是跟自行testing set測試結果相差甚遠,想請問有什麼辦法能讓自行測試的結果有代表性呢? 感謝!
回答列表
-
2019/10/26 下午 10:40Allen贊同數:0不贊同數:0留言數:0
可嘗試交叉驗證的方式,先證實有效的模型。
-
2019/10/29 下午 11:05張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
補充一下,交叉驗證的概念其實就是多做幾次取平均