資料的差異性是指什麼?
2019/07/24 下午 02:51
機器學習共學討論版
Wei Yee Lim
觀看數:30
回答數:2
收藏數:0
ml100-2-d61
ml100-2
您好,我想請問,當中資料的差異性是指什麼?是指差異性很低或線型相關時,
結果會很不好嗎?
回答列表
-
2019/07/25 下午 06:14張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
我猜這邊講的差異性應該是線性相關?或是等出題的專家來補充~
-
2019/08/06 上午 11:57陳明佑 (Ming You Chen)贊同數:1不贊同數:0留言數:0
這裡的差異性, 講的是特徵在不同資料間是否會一起出現,
這件事情在訓練與測試資料可能有很大差異
比如說 : A與B 性質類似, 而且對C這個目標都有正相關性
但如果 train 大部分的 C 都與 A 同時出現, 而訓練資料中大部分都只有 B 出現時
奇異值分解只換顯示 A對C有高度正相關, 但是 B對C的正相關性就不會被學到
在測試資料中, 也就預測不出對於B對C的正相關了
這個問題不僅僅是要資料量大, 並且所有事件都要均等出現才能避免