用Objection Detection API訓練遇到的問題?

2020/08/27 上午 00:00

電腦視覺深度學習討論版

SuYa

觀看數：9

回答數：1

收藏數：0

cvdl

cvdl-d48

目前都將圖片scale成618X618下去訓練，不過在google colab上訓練時卻遇到另一個問題

使用的預訓練模型為 faster_rcnn_nas，tf version 1.x(1.15.2)，batch size = 8，training steps = 150000，evaluation steps = 50，卻會在訓練階段顯示記憶體超過10%，而在訓練第一階段就停下來，即便後來將batch size調降成2，也是會遇到相同的問題

於是，我選了另一個較為輕量的模型來做訓練，ssd_mobilenet_v2，tf version 1.x(1.15.2)，batch size = 12，training steps = 150000，evaluation steps = 50，這次就能開始訓練，但跑得非常緩慢，最後超過colab使用時間12小時，就自己停下來了，training steps並沒有完全跑完，我後來檢查在tf version 1.x時，其訓練的速度就跟使用cpu幾乎一樣沒什麼不同，請問可以怎樣做調整才好?

回答列表

2020/09/04 上午 01:21

Jeffrey

贊同數：0

不贊同數：0

留言數：2

請問一下,

(1)執行環境有選GPU or TPU 的設定

(2) 資料集有多少張照片? 多少類別?

(3) epoch 設這個數字是因為有跑完過相同模型但是 accurancy 不好才增加的嗎?