Label encoding問題
2020/03/29 上午 10:40
機器學習共學討論版
毛
觀看數:1
回答數:2
收藏數:0
想請問 for col in app_train 應該是指針對app_train裡的資料作label encoding,但迴圈中卻提到 app_test[col] = le.transform(),不太懂為何可以這樣使用。
回答列表
-
2020/03/29 下午 04:46江柏勳贊同數:0不贊同數:0留言數:0
le
=
LabelEncoder
(),
app_test[col] = le.transform(app_test[col] ),le.transform()是對app_test每行做labelcoding ,然後把它指定給app_test[col](相當於把原本的蓋過去),不確定這樣的解釋是否很正確
(
le.transform()我在想就是這個東西的寫法?)
-
2020/03/29 下午 08:41張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
嗨,毛
```
for col in app_train: # 是取出 app_train 中的每個欄位名稱
app_train[col] = le.transform() # 針對 train 的 col 進行轉換
app_test[col] = le.transform() # 針對 test 的 col 進行轉換
```
之所以可以拿 train 的欄位對 test 作轉換,是因為他們應該要有「相同」的欄位才對。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃