logo
Loading...

請問 train_Y為什麼在定義時要使用np.log1p? 還有在捨棄離群值時為什麼要重新定義train_Y? - Cupoy

請問 train_Y為甚麼在定義時要使用np.log1p還有在捨棄離群值時為甚麼要重新定義train...

ml100-2

請問 train_Y為什麼在定義時要使用np.log1p? 還有在捨棄離群值時為什麼要重新定義train_Y?

2019/05/25 05:35 AM
機器學習新手論壇
蔡家倫
觀看數:0
回答數:2
收藏數:0
ml100-2

請問 train_Y為甚麼在定義時要使用np.log1p

還有在捨棄離群值時為甚麼要重新定義train_Y 謝謝


train_Y = np.log1p(df_train['SalePrice'])


# 將 1stFlrSF 限制在你覺得適合的範圍內, 捨棄離群值 

""" Your Code Here """ 

limit = (df['1stFlrSF'] > 500) & (df['1stFlrSF'] < 2000)

df = df[limit]

train_Y = train_Y[limit] 


sns.regplot(x = df['1stFlrSF'], y=train_Y)

 plt.show()  # 做線性迴歸, 觀察分數 

train_X = MMEncoder.fit_transform(df) estimator = LinearRegression() cross_val_score(estimator, train_X, train_Y, cv=5).mean()