logo
Loading...

相關係數問題 - Cupoy

我知道樣本自由度要-1,但是有的時候我已經在使用母體做分析了,這樣子還須要在前面-1嗎?,又,假如不...

ml100-3,ml100-3-d14

相關係數問題

2019/09/12 上午 11:56
機器學習共學討論版
JC
觀看數:48
回答數:1
收藏數:0
ml100-3
ml100-3-d14

我知道樣本自由度要-1,但是有的時候我已經在使用母體做分析了,這樣子還須要在前面-1嗎?,又,假如不在乎樣本或母體抽樣的差別,一率除以 n ,影響會很大嗎?


網路上常見的公式似乎都是 / n

回答列表

  • 2019/09/12 下午 04:22
    陳明佑 (Ming You Chen)
    贊同數:0
    不贊同數:0
    留言數:0

    如果是用母體分析, 就直接用下面的式子就好了


    但如果你是拿到的資料, 通常是屬於抽樣出的結果, 

    這時候用上面的公式似乎比較合理 (假如部分特徵有NaN, 這時兩兩變異樹樣本總量會不同)


    不過機器學習, 幾乎都沒有在討論這個問題

    主要是要用到機器學習, 資料數量通常都很大的關係

    另一方面, 也通常是呼叫套件的方法進行計算(例如: pandas.DataFrame.corr())

    比較少自己另外寫函數的關係