logo
Loading...

為何需要drop這個欄位?(df_test.drop(['PassengerId'] , axis=1)) - Cupoy

df_test = df_test.drop(['PassengerId'] , axis=1)想請...

為何需要drop這個欄位?(df_test.drop(['PassengerId'] , axis=1))

2020/03/29 下午 05:36
機器學習共學討論版
江柏勳
觀看數:1
回答數:2
收藏數:0

df_test = df_test.drop(['PassengerId'] , axis=1)

想請問一下這邊純粹只是為了讓資料能合併嗎?(concat的部分)

回答列表

  • 2020/03/29 下午 08:45
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:1

    嗨,柏勳


    主要原因應該是 PassengerId 是唯一的,因此在模型上沒有鑑別度,所以丟棄。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃

  • 2020/03/30 上午 00:09
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:2

    「可以解釋一下沒有鑑別度是甚麼意思嗎?


    => 如果我們想要用班上同學的資料去分析成績高低,那我們可以用男生/女生來做觀察,觀察的方式可能會用男生的平均跟女生的平均來觀察。但是如果用「座號」,因為座號是一種為一直,是無法代表背後的群體的。


    如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃