logo
Loading...

Lecture7. 相關性分析 - 快速入門、零成本!用 Looker Studio 輕鬆打造專業戰情面板 - Cupoy

每日主題知識點 ● 相關性分析● 相關性分析的種類● 相關係數計算 預錄影片 什麼是相關性分析 相關分析是對總體中確實具有聯繫的變數進行分析,並確認兩指變數之相關程度。描述客觀事物相互間關係的密...

每日主題知識點 ● 相關性分析● 相關性分析的種類● 相關係數計算 預錄影片 什麼是相關性分析 相關分析是對總體中確實具有聯繫的變數進行分析,並確認兩指變數之相關程度。描述客觀事物相互間關係的密切程度並統計指標表示出來的過程。 以散佈圖來表示相關性: 根據散佈圖,當自變數取某一值時,因變數對應為一機率分佈 ,如果對於所有的自變數取值的機率分佈都相同,則說明兩變數是沒有相關關係的。反之,自變數的取值不同,因變數的分佈也不同,則說明兩者是存在相關關係的。散佈圖的主要目的在於找尋兩個指標間的「相關性」,不論是縱軸還是橫軸,都是指標,而非維度。維度中的每一列,則是散佈圖中的資料點。舉例來說,如果想要檢視兩指標是否有相關性,便可透過繪製散佈圖來驗證。利用直角坐標系第一象限,把自變數置於橫軸上,因變數置於縱軸上,而將兩變數相對應的變數值 用坐標形式描繪出來,用以標示相關點分佈狀況的圖形,而依照分布狀態畫出來的線為相關曲線。 例如在一段時期內串流平台購買量隨全球疫情嚴重程度上升,這說明兩指標間是正相關關係,如下圖;而在另一時期,隨著全球疫情趨緩,串流平台購買量出現下降的現象,兩指標間就是負相關關係,如下圖。 以相關表表示相關性: 相關表是能夠反映兩個或兩個以上變量之間的相互關係的統計表式。當觀察的單位數目較少時,通過整理以後就可以用普通的表式將資料一一對照起來,而當觀察的單位數目較多且變量的變異又較為複雜時,則需要將資料進行分組,製作特殊的相關表。由於相關分析是研究兩個或兩個以上標誌的關係,因此,需要確定組距和組數以使二者的關係能在表中明顯地反映出來。如下表(某商店10名售貨員的工齡和日工資的相關係表): 簡單相關表 簡單相關表是把因素標誌值按照從小到大的順序並配合結果標誌值一一對應而平行排列起來的統計表。是變量之間相關研究初步結果的表現。表中X與Y兩的變量值,如下表: 例如,為研究分析產量和單位成本的關係,調查30個同類企業得到資訊,如下表: 根據上述資料,製作如下簡單相關表: 從表中可以看出,隨著產量的增加,單位成本也有降低的趨勢。儘管在同樣產量的情況下,單位成本存在差異,但是仍然看得出兩者存在一定的相關性。 相關性分析的種類 按相關的程度分為完全相關、不完全相關和不相關完全相關 兩種依存關係的標誌,其中一個標誌的數量變化由另一個標誌的數量變化所確定,則稱 - 完全相關,也稱函數關係。 不相關 兩個標誌彼此互不影響,其數量變化各自獨立,稱為不相關。不完全相關 兩個現象之間的關係,介乎完全相關與不相關之間稱不完全相關。 線性相關 按相關的形式分為線性相關和非線性相關若某數學函數或數量關係的函數圖形呈現為一條直線或線段,那麼這種關係就是一種線性的關係。非線性相關 非線性系統的行為可以用一組非線性聯立方程式來描述,通常為曲線。 相關係數 雖然Looker Studio內無法直接計算相關係數,但是仍然可以用來輔助圖表說明,例如兩張斜率差不多的圖表,肉眼不容易直接看出兩圖表之相關程度需要將相關程度量化時,就可以用相關係數來輔助說明。 兩個變數之間的相關程度通常用相關係數r來表示,公式如下。 其中 代表樣本平均值。 相關係數r的值在-1和1之間,但可以是此範圍內的任何值。正相關時,r值在0和1之間,散佈圖是斜向上的,這時一個變數增加,另一個變數也增加; 負相關時,r值在-1和0之間,散佈圖是斜向下的,此時一個變數增加,另一個變數將減少。 當相關係數r的絕對值越接近1當r = 1當r = -1,兩變數的關聯程度越強,r的絕對值越接近1,兩變數的關聯程度越弱 r 越接近 0 知識點總整理 ● 相關性分析● 相關性分析的種類● 相關係數計算 延伸閱讀 對於相關係數相關知識還有很多值得探討的部分,甚至跟之前介紹過的標準差也有相關,大家若是有興趣可以多了解https://zh.wikipedia.org/zh-tw/%E7%9A%AE%E5%B0%94%E9%80%8A%E7%A7%AF%E7%9F%A9%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0