ResNet50 模型的預設輸入尺寸是為224 * 224 ,為何解答中要把圖像 resize 成240 *320 ? 用模型的默認的圖像尺寸是否會更適合原來模型的訓練權重?
2019/05/08 下午 06:26
機器學習共學討論版
高啟益
觀看數:205
回答數:3
收藏數:0
kaggle
期末考
ml100
ml100-d101
1.期末考解答的 Resnet50 預訓練模型,使用 ImageDataGenerator的flow_from_directory 方法來載入訓練圖形的資料,請問為什麼不需要做rescal (圖像除以255) ?
2.訓練完成之後,有重新載入 callbacks 紀載的最佳模型,但是在後續的預測作業時,卻沒有使用載入的最佳模型,請問是程式碼寫錯還是有特殊原因?
(載入的最佳模型是放到 best_model 這個變數中,但是預測時卻是用 model 這個原始模型的變數)
回答列表
-
2019/05/09 上午 10:49Jimmy贊同數:2不贊同數:0留言數:0
Hi 啟益!
Thanks for pointing out the problems! 看來的確是有些小 bug,我們馬上修正一下等等會上傳修正版的解答:)
-
2019/05/09 上午 11:18高啟益贊同數:0不贊同數:0留言數:0
另外, ResNet50 模型的預設輸入尺寸是 224 * 224 ,為何解答中要把圖像 resize 成240 *320 ?
用模型的默認的圖像尺寸是否會更適合原來模型的訓練權重?
-
2019/05/09 下午 02:02Jimmy贊同數:2不贊同數:0留言數:0
Hi! 縮放成 240x320 的原因是,觀察資料集發現多數的影像都是這個尺寸,當縮放成 224x224 會改變原本影像的長寬比 ratio,有些影像可能會失真的比較嚴重。當然 224x224 也是可以訓練的,兩種方法都還是從預訓練的權重開始進行訓練,應該不會差異太多,你可以比較看看這兩種方法是不是有明顯的差異