logo
Loading...

Day7作業,為何在重組資料成為訓練 / 預測用格式中,去做'PassengerId'與'Survived'移除? - Cupoy

train_Y = df_train['Survived']   ids = df_test['Pa...

Day7作業,為何在重組資料成為訓練 / 預測用格式中,去做'PassengerId'與'Survived'移除?

2020/07/06 下午 05:50
機器學習共學討論版
KO
觀看數:2
回答數:2
收藏數:0

   train_Y = df_train['Survived']

   ids = df_test['PassengerId']

1.df_train = df_train.drop(['PassengerId', 'Survived'] , axis=1)

2.df_test = df_test.drop(['PassengerId'] , axis=1)

   df = pd.concat([df_train,df_test])

   df.head()

你好,我想詢問,1.與2.,為什麼要對'PassengerId', 'Survived'這兩筆資料做dorp?

感謝回答!

回答列表

  • 2020/07/08 上午 00:53
    Jeffrey
    贊同數:1
    不贊同數:0
    留言數:0

    因為我們把'PassengerId', 'Survived'拿出來給test, train 的 label. 所以必須從特徵值的序列移除.

  • 2020/07/09 下午 03:27
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    因為這兩個欄位是所有人都不同的唯一值,因此是無法來做分類的