output tenseor中class的疑問?
您好, 想問為甚麼class只需一組呢?
理解上會認為, 雖然都在同一個grid裡面, 但其得出的bbox會有不同大小以及偏移
所以兩個bbox可能會對應到不同物件, 而有各自對應類別的機率
還是依照設計的出發點, 每個grid只會存在一種物件,
所以同一個grid, 雖然有兩個bbox, 但只是多一個機會, 看哪個bbox的confidence比較好,
就代表該grid得出的物件位置資訊, 並加入類別, 去作下一步的NMS的比較
若是這樣, 當設定為切分成7x7個grid時, 則一張影像是否最多只能標出49個物件嗎(因為一個gird無法存在兩個物件)?
而當實際情形, 有兩個物件的中心點接近時(quantized到同一個grid), 則其中一個物件無法被偵測
回答列表
-
2020/04/01 下午 04:21胡連福贊同數:0不贊同數:1留言數:2
如果您是指 Yolo 輸出的 7x7x30 tensor 的話,輸出會有二組 bbox,理論上第一組的 confidence存在 target[:, :, 4] 的位置,第二組的 confidence會存在 target[:, :, 9] 的位置。
-
2020/04/05 上午 11:50Jeffrey贊同數:1不贊同數:1留言數:0
有兩個物件的中心點接近時(quantized到同一個grid), 則其中一個物件無法被偵測
==> 如果單單加入類別機率是不行的,如果一個grid要預測兩個目標,設定B=2去預測出2個bounding box, 則是需要定義各自給它哪個標籤(label),還有哪個BOX該檢測誰?
-
2020/04/07 上午 09:43Mora贊同數:1不贊同數:1留言數:3
你的提問很好,在day32是介紹yolov1的模型架構,你提問到yolov1的最大缺失點,這樣的模型假設每一個grid只能估計出一個物體的類別,你可以把這問題記錄起來,在yolov2的時候,可以觀察一下模型的變化,模型做了怎樣的調整,就能每一個bbox中個別設定不同的class。
-
2020/04/07 下午 08:17Mora贊同數:1不贊同數:0留言數:1
這張是用yolov3拿來做小物體和小物體包含在大物體的辨識,發現yolov3可以增進這兩個面向的能力,但難免還是會有漏掉的部分,在專題裡面,小袋鼠無法辨識出來,有一個可能為小袋鼠的標記數量比較小可能為原因之一,可以嘗試把小袋鼠數量變多試試。