logo
Loading...

判斷相關性可信度P-Value 透過計算 p value,得到假設的可信度,若 p value 的值小於 5%,則兩筆資料不相關? - Cupoy

判斷相關性可信度P-Value• Null hypothesis (假設檢定)• 透過計...

判斷相關性可信度P-Value 透過計算 p value,得到假設的可信度,若 p value 的值小於 5%,則兩筆資料不相關?

2021/07/04 下午 10:39
資料清洗(Data Cleaning)
Ma Chao Ting
觀看數:26
回答數:1
收藏數:0

判斷相關性可信度P-Value • Null hypothesis (假設檢定) • 透過計算 p value,得到假設的可信度,若 p value 的值小於 5%,則兩筆資料不相關 但是在上課時卻說 視覺化相關性出來的p value卻說越接近零,相關性的可性度越高 我有點疑惑

回答列表

  • 2021/07/05 下午 02:50
    Lance
    贊同數:1
    不贊同數:0
    留言數:0

    不好意思我的語意不清,其實要看假設檢定是怎麼設定的,假設今天計算出一個特徵與預測目標相關係數為 0.78,p_val 為 0.045,假設檢定就有兩種設定方式(剛好反過來),如下: 假設a H0: r = 0.78 H1: r != 0.78 在 a 假設下,p_val < 0.05 ,落在拒絕區(推翻H0),故 r 實際上可能不是0.78 or 假設b H0: r != 0.78 H1: r = 0.78 在 b 假設下,p_val < 0.05 ,落在拒絕區(推翻H0),故 r 很大機會就是0.78 那在 scipy 計算相關係數的模組中,採用的是假設b,所以如課堂中畫的熱點圖(下圖),大部分資料的可性度是很高的。 ![Screen Shot 2021-07-05 at 2.43.33 PM.png](http://kwassistfile.cupoy.com/0000017A755A56BE000000066375706F795F72656C65617365414E53/1625207534835/large)