cross_val_score的問題

2019/09/08 上午 10:53

機器學習共學討論版

林修德

觀看數：81

回答數：2

收藏數：0

ml100-3-d12

ml100-3

您好：

在程式範例中，是這樣寫的：

train_num = train_Y.shape[0]

df_mn = df.fillna(df.mean())

train_X = df_mn[:train_num]

estimator = LinearRegression()

cross_val_score(estimator, train_X, train_Y, cv=5).mean()

疑問如下：

為什麼在train_X 只用df_mn[:train_num]部分的資料進行分析？

train_num以後的資料是直接忽視嗎？

空缺值卻是用完整的df_mn.mean()填補？而不是用df_mn[:train_num].mean()填補？

還是我漏了什麼需要再看哪些課程？

以上，謝謝。