CV領域的問題與相關比賽 該如何挑選適當的模型
最近我在想的一個問題
在實際運用上,我們應該如何挑選適切的模型。
例如專處理Classification的VGG、Resnet、Inception等等...
亦或是適合做object detection的SSD、YOLO等等....
目前我的想法是按照取資料(拍照)的環境來思考要使用甚麼樣的模型
如果是簡單環境就用VGG;複雜環境就使用Inception。
想請教一下 各位老師對於選擇模型通常依據甚麼來選擇?
第二個問題是 未來我想走CV工程師
勢必要一直關注此領域的發展
不過目前大家熟知的imagenet比賽已經停辦了很久
不知各位老師有沒有其他推薦可以關注的比賽? 查了一陣子都沒查到適合的
或是有沒有推薦可以關注全世界模型發展的資源?
這邊先謝謝各位老師解答
回答列表
-
2020/08/13 下午 10:22Jeffrey贊同數:1不贊同數:0留言數:0
問題 (1):
Hello, 基本上會根據三點:
1. 想解決的問題: 分類? 物件? 人? 生物體? 一次最多偵測與辨識的數量?
2. 資料集: 資料集有無大小不一的物件要同時辨識? 需不需要標記?
3. 使用的情境? 都在雲端做偵測與辨識還是在前端? 前端運算資源有多少?
舉例, 假設要在device 端把人臉偵測, 辨識一起做完, 同時做多人臉, 用的是 mobilenet-ssd.
若是, 大資料集的物件辨識兼顧ground-truth - Inception or Inception-resnet .
若是, 單一場景多類物件同時辨識, 可以考慮 yolov3/yolov4.
VGG 系列的參數量太大 , 已經很少用在實際的場景.
問題(二):
可以參考幾個:
1. Edge Computing: Vision and Challenges
2. Kaggle 上的比賽
3. Image and Vision Computing