logo
Loading...

資料處理與特徵工程 - 精選影片1 - 資料科學流程與特徵工程重要性 - 資料處理與特徵工程 - Cupoy

資料科學流程: 很多資料來源蒐集到的資料→Raw Data→Clean and Transform→產生有用特徵→建模→獲取洞見 特徵工程重要性: - 「垃圾進,垃圾出」是資料科學典型的名言...

資料科學流程: 很多資料來源蒐集到的資料→Raw Data→Clean and Transform→產生有用特徵→建模→獲取洞見 特徵工程重要性: - 「垃圾進,垃圾出」是資料科學典型的名言,代表資料若沒有產生適當的特徵,訓練出的模型也不會有好的結果。 - 特徵會牽涉到領域知識,它可以幫助我們提升模型訓練的成效與洞見。 - 數據與特徵本身就決定了機器學習的上限,而模型就只是逼近該上限而已。 特徵工程在資料科學扮演的角色: - 屬於最有創意的一環 - 需要許多腦力激盪 - 最能影響模型效能的過程