Loading...

為甚麼建立train_X時，需要在train_X後加入[:train_num]，使得train_X = df_temp[:train_num]，讓train_X.shape[0]=train_Y.shape[0]? - Cupoy

你好為甚麼建立train_X時，需要在train_X後加入[:train_num]， ...

ml100-2,ml100-2-d22

AI共學社群

為甚麼建立train_X時，需要在train_X後加入[:train_num]，使得train_X = df_temp[:train_num]，讓train_X.shape[0]=train_Y.shape[0]?

2019/07/04 下午 08:52

機器學習共學討論版

ting

觀看數：33

回答數：2

收藏數：0

ml100-2

ml100-2-d22

你好

為甚麼建立train_X時，需要在train_X後加入[:train_num]，使得train_X = df_temp[:train_num]，

讓train_X.shape[0]=train_Y.shape[0]?

回答列表

2019/07/05 下午 05:11

陳明佑 (Ming You Chen)

贊同數：1

不贊同數：0

留言數：0

同學您好 :

這主要是因為在做特徵工程的時候

將 train_X 與 test_X 合併一起處裡, 比較方便(不用重複打兩次)

這樣做唯一的不便之處, 只在於處理完後要重新切開, 而您提的就是切開的這行程式

因為必須要告訴程式從哪裡切開, 而 train_num 就是存切開的位置

您也可以選擇不這樣做

只是中間特徵工程的部分, train與test就要分開打, 而且不能遺漏喔
2019/07/08 上午 10:35

張維元 (WeiYuan)

贊同數：2

不贊同數：0

留言數：0

這個是手動切 train_X & test_X 的做法，其實也可以用 train_test_split 處理。或是特徵工程做完，到訓練模型前再切！