Kaggle的public和private的差別是?
2019/06/16 下午 11:56
機器學習共學討論版
JJLai
觀看數:9
回答數:2
收藏數:0
Kaggle
目前public是使用auc作為分數,所以排行在private裡面,不是也會是一樣的嗎?
為什麼還要特別勾選2次送出,不是就以送出中AUC最高的作最後的評分就好了嗎?
不太懂,請解惑,所以我在勾選時,應該是也選2個auc最高的來送出就好,對吧?!!
回答列表
-
2019/06/17 上午 10:29陳明佑 (Ming You Chen)贊同數:0不贊同數:0留言數:1
不一樣喔
因為送出的答案中, 只有一半的預測用於 public 的分數, private 是另一半
這樣的設計是 Kaggle 競賽的傳統,
避免參賽者暴力試出部分解答, 專心在模型的調整上
所以勾選的時候, 建議挑你覺得"應該最好"的解
因為有的送出只是運氣好, 沒經過集成就很高分
通常花比較多時間的答案, private 會比較好
-
2019/06/18 上午 11:46張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
「不知道沒有勾選的,能不能知道private的分數」
=> 如果沒有勾選的話,應該視為沒有上傳 private 模型吧?
另外節錄這篇教學的說明做補充:
- public : 在競賽期間能看到的就是public leader board,參加者可以依據上傳的分數結果,來調整自己的模型。
- private : 在競賽結束之後才能看到private leader board,最後獲獎的實際名次是根據此來決定的。
參賽者在競賽期間其實只能知道一部分預測結果是好是壞,另一部分則無從得知,因此,在競賽期間看到的名次,其實不一定會是最後結算的名次,該如何在private leader board上拿到好的名次,就是所有參賽者要努力的地方。