請問python是有nan就不會被考慮嗎,還是哪些情況下nan不會被考慮?以及類別資料的轉換方式
Q2.檔案Day_006_column_data_type In [6]: 的結果顯示 3 columns were label encoded.但如果回到Out [4] :可以看到 EMERGENCYSTATE_MODE的type也是object且也<=2但沒有被In [6]: 轉換,請問原因為何
專家回答:=> 你可以把 EMERGENCYSTATE_MODE 的資料印出來看看,我猜是他其中有 NaN 導致沒有被考慮到
!!這次問題:我有印出來了,確實有nan,請問python是有nan就不會被考慮嗎,還是哪些情況下nan不會被考慮
Q3.檔案Day_006_column_data_type In [7]: 中被轉換的欄位有哪些?如果前面Label encoding已經轉換過那In [7]這個cell再執行時還會被轉換成one hot encoding 嗎?
專家回答:=> 你是指這一段程式碼嗎?
```
app_train = pd.get_dummies(app_train)
app_test = pd.get_dummies(app_test)
```
pd.get_dummies 只會針對類別型的資料(也就是沒有 label 過的資料)作轉換,這個部分下次建議可以自己印出來觀察,印象會比較深刻:)
!!這次問題:檔案Day_006_column_data_type In [7]: 中,是在做One Hot encoding,請問因為In [6]:已經做過Label encoding的欄位In [7]還會再做One Hot encoding的轉換嗎?另外我知道可以把app_train被轉換前後都print出來一個一個欄位去比對,請問有沒有更快的方式知道被轉換的欄位有哪些