logo
Loading...

用Objection Detection API訓練遇到的問題? - Cupoy

目前都將圖片scale成618X618下去訓練,不過在google colab上訓練時卻遇到另一個問...

cvdl,cvdl-d48

用Objection Detection API訓練遇到的問題?

2020/08/27 上午 00:00
電腦視覺深度學習討論版
SuYa
觀看數:9
回答數:1
收藏數:0
cvdl
cvdl-d48

目前都將圖片scale成618X618下去訓練,不過在google colab上訓練時卻遇到另一個問題

使用的預訓練模型為 faster_rcnn_nas,tf version 1.x(1.15.2),batch size = 8,training steps = 150000,evaluation steps = 50,卻會在訓練階段顯示記憶體超過10%,而在訓練第一階段就停下來,即便後來將batch size調降成2,也是會遇到相同的問題



於是,我選了另一個較為輕量的模型來做訓練,ssd_mobilenet_v2,tf version 1.x(1.15.2),batch size = 12,training steps = 150000,evaluation steps = 50,這次就能開始訓練,但跑得非常緩慢,最後超過colab使用時間12小時,就自己停下來了,training steps並沒有完全跑完,我後來檢查在tf version 1.x時,其訓練的速度就跟使用cpu幾乎一樣沒什麼不同,請問可以怎樣做調整才好?

回答列表

  • 2020/09/04 上午 01:21
    Jeffrey
    贊同數:0
    不贊同數:0
    留言數:2

    請問一下, 

    (1)執行環境有選GPU or TPU 的設定

    (2) 資料集有多少張照片? 多少類別?

    (3) epoch 設這個數字是因為有跑完過相同模型但是 accurancy 不好才增加的嗎?