YOLO boxes程式碼問題 什麼時候需要標準化 - Cupoy

cell_size = 1./grid_num想請問上述這端code的意義是什麼?不是很了解為什麼c...

d32

YOLO boxes程式碼問題 什麼時候需要標準化

2020/02/14 下午 09:15
電腦視覺深度學習討論版
Tie
觀看數:14
回答數:1
收藏數:1
d32

cell_size = 1./grid_num

想請問上述這端code的意義是什麼?

不是很了解為什麼cell_size必須要在0~1的範圍,

看到後面只是利用cell_size轉出target所在7x7方格的index。

這些動作是為了一般化嗎?因為可能不是7x7,透過這樣的轉換可以讓任意size,

最後都可以轉換到對應的index嗎?


boxes[:, [0, 2]] = boxes[:, [0, 2]] / img.shape[1]    #   

boxes[:, [1, 3]] = boxes[:, [1, 3]] / img.shape[0]    #   


以及上述這兩段code,為什麼這裡要標準化?



先謝謝您的回應~~~

回答列表

  • 2020/02/15 下午 02:47
    楊哲寧
    贊同數:1
    不贊同數:0
    留言數:0

    您好,您的理解沒錯,將normalize座標資訊的好處在於,無論我們之後將影像resize到多大,都能輕易的回放。像是在計算bounding box 時(算 loss或 inference),我們取用了多種不同尺度的feature Map (SSD、YoloV2之後),resize過後的資訊能夠較容易的操作。

    另外一個常見normalize的第方是計算bounding box 的 loss,這邊normalize的目的在於不希望loss值受到目標尺寸的影響。