logo
Loading...

訓練集中有的特徵含有缺失值,一般怎麼處理? - Cupoy

訓練集樣本中有的數值特徵列含有缺失值,一般怎麼處理?我一般都是取這一列的平均值,有更好的方法,或者其...

訓練集中有的特徵含有缺失值,一般怎麼處理?

1970/01/01 上午 08:00
觀看數:0
回答數:4
收藏數:0

回答列表

  • 1970/01/01 上午 08:00
    贊同數:
    不贊同數:
    留言數:

  • 1970/01/01 上午 08:00
    Jeffrey
    贊同數:1
    不贊同數:0
    留言數:0

  • 1970/01/01 上午 08:00
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

  • 2020/05/09 下午 08:52
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    「2. 預測法 把這一列當成標籤,用剩下變量來預測缺失值。 一般用比較簡單的模型,比如可以用kNN,regression tree。 這個方法的缺點是引入了偏差。」

    => 實務上不建議這麼做,因為這樣等於是把預測的結果在做預測,有可能會惡性循環。