交叉驗證(cross validation) 問題
2020/06/29 下午 05:43
機器學習共學討論版
張天恩
觀看數:3
回答數:2
收藏數:0
day27
cross_val_score
你好,想請問交叉驗證在線性迴歸得到的分數應該如何判斷好壞(如下圖),第一張圖是對照組的結果:
這是增加'星期幾'與'第幾周'變數後,交叉驗證的結果:
看起來分數是有稍微增加。再看看加上'日週期'變數後,交叉驗證的結果:
第一次新增變數後的結果看起來分數有稍微增加,第二次新增變數後的結果分數略減。我原本理解 cross_val_score 的分數應該代表R square值,也就是迴歸預測能解釋模型的能力,照理來說該值越高對於迴歸模型來說應該更準確。但是範例的解釋是這樣說:
範例解釋的結果似乎跟我原本理解的不太一樣,想請 專家/其他同學 幫忙解惑~
回答列表
-
2020/06/30 下午 08:35Jeffrey贊同數:1不贊同數:0留言數:0
cross_val_score 的分數越高對於迴歸模型來說應該更準確 --> 對的
範例的解釋是針對 feature set 增減與變化, 來對應到cross_val_score 的變化, 不是只說固定的feature set, 這是合理的
-
2020/07/01 上午 00:55張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0
cross_val_score 越高,除了模型準確之外,也代表模型用於不同的 sample 的彈性也比較大,避免 overfitting 的問題。不過你這幾個分數,看起來沒有差很多,應該都是在誤差範圍內,建議多跑幾次,或是換大一點的資料。
如果這個回答對你有幫助請主動點選「有幫助」的按鈕,也可以追蹤我的GITHUB帳號。若還有問題的話,也歡迎繼續再追問或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃