相關係數問題
2019/09/12 上午 11:56
機器學習共學討論版
JC
觀看數:48
回答數:1
收藏數:0
ml100-3
ml100-3-d14
我知道樣本自由度要-1,但是有的時候我已經在使用母體做分析了,這樣子還須要在前面-1嗎?,又,假如不在乎樣本或母體抽樣的差別,一率除以 n ,影響會很大嗎?
網路上常見的公式似乎都是 / n
回答列表
-
2019/09/12 下午 04:22陳明佑 (Ming You Chen)贊同數:0不贊同數:0留言數:0
如果是用母體分析, 就直接用下面的式子就好了
但如果你是拿到的資料, 通常是屬於抽樣出的結果,
這時候用上面的公式似乎比較合理 (假如部分特徵有NaN, 這時兩兩變異樹樣本總量會不同)
不過機器學習, 幾乎都沒有在討論這個問題
主要是要用到機器學習, 資料數量通常都很大的關係
另一方面, 也通常是呼叫套件的方法進行計算(例如: pandas.DataFrame.corr())
比較少自己另外寫函數的關係