圖片normalization問題
2019/12/12 下午 02:32
電腦視覺深度學習討論版
黃易辰
觀看數:16
回答數:1
收藏數:0
cvdl-1
cvdl-1-d15
關於測試圖片的normalization的有一些疑問 :
1. 我們在測試圖片的normalization是按照訓練集的分佈, 而不是測試集自己本身的分佈 或(訓練集+測試集)的分佈
想請問後者與前者在統計意義上的差異?
我的疑惑是 ~ 真正模型落地時, 測試集跟訓練集不見得會有相同的分佈
2. 測試圖片的normalization是based on RGB所有一起算mean , 以及所有RGB一起算的std
想請問為何不是每個channel分別取mean 跟 std?
回答列表
-
2019/12/12 下午 04:59楊哲寧贊同數:2不贊同數:0留言數:0
您好,針對以下幾種情況回答:
1. Normalization 包含訓練集與測試集:這樣的話並不客觀,等於我們偷看了測試集的資料分佈,再決定Normalization 的值。
2.依照測試集本身訊息做Normalization:這樣並沒有統計上的意義,並且我們有時只測試單張影像,就無從Normalize 。
3.其實所有NN模型在預測沒看過的資料時,都是在找其與訓練集上相似的資訊分佈,因此當訓練集與測試集的訊息分佈完全不相同時,模型本身也無法給予正確的答案。
4.有關於RGB的部分,確實可以將每一層拆開算一個mean與std。
Nomination 的方式很多種,其實只要確保訓練與測試的資料在相同的scale內,理論上模型都有辦法預測,因此近期常見作法如(x/127.5)-1,,將所有資訊壓縮到-1到1之間等等。