為何需要drop這個欄位?(df_test.drop(['PassengerId'] , axis=1))
2020/03/29 下午 05:36
機器學習共學討論版
江柏勳
觀看數:1
回答數:2
收藏數:0
df_test = df_test.drop(['PassengerId'] , axis=1)
想請問一下這邊純粹只是為了讓資料能合併嗎?(concat的部分)
回答列表
-
2020/03/29 下午 08:45張維元 (WeiYuan)贊同數:0不贊同數:0留言數:1
嗨,柏勳
主要原因應該是 PassengerId 是唯一的,因此在模型上沒有鑑別度,所以丟棄。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃
-
2020/03/30 上午 00:09張維元 (WeiYuan)贊同數:1不贊同數:0留言數:2
「可以解釋一下沒有鑑別度是甚麼意思嗎?」
=> 如果我們想要用班上同學的資料去分析成績高低,那我們可以用男生/女生來做觀察,觀察的方式可能會用男生的平均跟女生的平均來觀察。但是如果用「座號」,因為座號是一種為一直,是無法代表背後的群體的。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃