Day7作業,為何在重組資料成為訓練 / 預測用格式中,去做'PassengerId'與'Survived'移除?
2020/07/06 下午 05:50
機器學習共學討論版
KO
觀看數:2
回答數:2
收藏數:0
train_Y = df_train['Survived']
ids = df_test['PassengerId']
1.df_train = df_train.drop(['PassengerId', 'Survived'] , axis=1)
2.df_test = df_test.drop(['PassengerId'] , axis=1)
df = pd.concat([df_train,df_test])
df.head()
你好,我想詢問,1.與2.,為什麼要對'PassengerId', 'Survived'這兩筆資料做dorp?
感謝回答!
回答列表
-
2020/07/08 上午 00:53Jeffrey贊同數:1不贊同數:0留言數:0
因為我們把'PassengerId', 'Survived'拿出來給test, train 的 label. 所以必須從特徵值的序列移除.
-
2020/07/09 下午 03:27張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
因為這兩個欄位是所有人都不同的唯一值,因此是無法來做分類的