CNN 模型及遷移學習基礎 機器學習 v.s. 深度學習 傳統影像辨識 (仰賴人工取特徵) 現今影像辨識 (自動特徵萃取) 深度學習 = 層次化表示學習 (Representation Learning) An Example of CNN Model 圖的構成:線條 → 圖案 (pattern) → 物件 → 場景 圖片來源 圖片來源 CNN模型的使用動機 DNN 的權重參數過多,占用太多記憶體,而且訓練時間過長。 優點 降低參數量 執行時間加速 結合影像特性 不再需要專家設計捲積核 深度學習在電腦視覺重大突破! 不同種類的神經網路 遷移學習 Transfer Learning 遷移學習是一種機器學習技術,通過將已訓練模型在某個任務中獲得的知識轉移到另一個相關任務中,以提高新任務的學習效率和效果。 **特徵抽取 (Feature Extraction)**:使用預訓練模型的部分層作為特徵提取器,僅調整最後的分類層。 **微調 (Fine-Tuning)**:在預訓練模型的基礎上,針對新任務進行微調,調整部分或全部層的權重。 利用已有知識,減少新任務所需的訓練數據和時間。 SOTA CNN Model Model Size (MB) Top-1 Accuracy Parameters Depth ConvNeXtXLarge 1310 86.70% 350.1M EfficientNetV2L 479 85.70% 119.0M NASNetLarge 343 82.50% 88.9M 533 InceptionResNetV2 215 80.30% 55.9M 449 Xception 88 79.00% 22.9M 81 EfficientNetV2B0 29 78.70% 7.2M ResNet152V2 232 78.00% 60.4M 307 InceptionV3 92 77.90% 23.9M 189 DenseNet201 80 77.30% 20.2M 402 ResNet101V2 171 77.20% 44.7M 205 NASNetMobile 23 74.40% 5.3M 389 VGG16 528 71.30% 138.4M 16 MobileNetV2 14 71.30% 3.5M 105