logo
Loading...

output tenseor中class的疑問? - Cupoy

您好, 想問為甚麼class只需一組呢?理解上會認為, 雖然都在同一個grid裡面, 但其得出的bb...

cvdl-2

output tenseor中class的疑問?

2020/04/01 上午 00:45
電腦視覺深度學習討論版
周彥仰
觀看數:15
回答數:4
收藏數:0
cvdl-2

您好, 想問為甚麼class只需一組呢?

理解上會認為, 雖然都在同一個grid裡面, 但其得出的bbox會有不同大小以及偏移

所以兩個bbox可能會對應到不同物件, 而有各自對應類別的機率


還是依照設計的出發點, 每個grid只會存在一種物件,

所以同一個grid, 雖然有兩個bbox, 但只是多一個機會, 看哪個bbox的confidence比較好,

就代表該grid得出的物件位置資訊, 並加入類別, 去作下一步的NMS的比較


若是這樣, 當設定為切分成7x7個grid時, 則一張影像是否最多只能標出49個物件嗎(因為一個gird無法存在兩個物件)?

而當實際情形, 有兩個物件的中心點接近時(quantized到同一個grid), 則其中一個物件無法被偵測

回答列表

  • 2020/04/01 下午 04:21
    胡連福
    贊同數:0
    不贊同數:1
    留言數:2

    如果您是指 Yolo 輸出的 7x7x30 tensor 的話,輸出會有二組 bbox,理論上第一組的 confidence存在 target[:, :, 4]  的位置,第二組的 confidence會存在 target[:, :, 9]  的位置。

  • 2020/04/05 上午 11:50
    Jeffrey
    贊同數:1
    不贊同數:1
    留言數:0

    有兩個物件的中心點接近時(quantized到同一個grid), 則其中一個物件無法被偵測

    ==> 如果單單加入類別機率是不行的,如果一個grid要預測兩個目標,設定B=2去預測出2個bounding box, 則是需要定義各自給它哪個標籤(label),還有哪個BOX該檢測誰?

  • 2020/04/07 上午 09:43
    Mora
    贊同數:1
    不贊同數:1
    留言數:3

    你的提問很好,在day32是介紹yolov1的模型架構,你提問到yolov1的最大缺失點,這樣的模型假設每一個grid只能估計出一個物體的類別,你可以把這問題記錄起來,在yolov2的時候,可以觀察一下模型的變化,模型做了怎樣的調整,就能每一個bbox中個別設定不同的class。

  • 2020/04/07 下午 08:17
    Mora
    贊同數:1
    不贊同數:0
    留言數:1

    這張是用yolov3拿來做小物體和小物體包含在大物體的辨識,發現yolov3可以增進這兩個面向的能力,但難免還是會有漏掉的部分,在專題裡面,小袋鼠無法辨識出來,有一個可能為小袋鼠的標記數量比較小可能為原因之一,可以嘗試把小袋鼠數量變多試試。