YOLO boxes程式碼問題 什麼時候需要標準化
2020/02/14 下午 09:15
電腦視覺深度學習討論版
Tie
觀看數:14
回答數:1
收藏數:1
d32
cell_size = 1./grid_num
想請問上述這端code的意義是什麼?
不是很了解為什麼cell_size必須要在0~1的範圍,
看到後面只是利用cell_size轉出target所在7x7方格的index。
這些動作是為了一般化嗎?因為可能不是7x7,透過這樣的轉換可以讓任意size,
最後都可以轉換到對應的index嗎?
boxes[:, [0, 2]] = boxes[:, [0, 2]] / img.shape[1] #
boxes[:, [1, 3]] = boxes[:, [1, 3]] / img.shape[0] #
以及上述這兩段code,為什麼這裡要標準化?
先謝謝您的回應~~~
回答列表
-
2020/02/15 下午 02:47楊哲寧贊同數:1不贊同數:0留言數:0
您好,您的理解沒錯,將normalize座標資訊的好處在於,無論我們之後將影像resize到多大,都能輕易的回放。像是在計算bounding box 時(算 loss或 inference),我們取用了多種不同尺度的feature Map (SSD、YoloV2之後),resize過後的資訊能夠較容易的操作。
另外一個常見normalize的第方是計算bounding box 的 loss,這邊normalize的目的在於不希望loss值受到目標尺寸的影響。