logo
Loading...

線性回歸的殘差分析的定義為何另有哪些實務上的助益? - Cupoy

在線性回歸的過程中, 常有聽過需要做殘差分析 想跟各位專家請教,做殘差分析的目的為何? 對於我的迴歸...

線性回歸的殘差分析的定義為何另有哪些實務上的助益?

2022/02/25 上午 10:43
regression vs. classification
Yaoga
觀看數:784
回答數:1
收藏數:0

在線性回歸的過程中, 常有聽過需要做殘差分析 想跟各位專家請教,做殘差分析的目的為何? 對於我的迴歸模型能有什麼樣的幫助?如提升預測能力? 另外要做殘差分析的話是又如何進行 感謝~

回答列表

  • 2022/02/27 下午 06:17
    王健安
    贊同數:0
    不贊同數:0
    留言數:2

    Yaoga 您好, 殘差分析(Residual Analysis)是統計領域當中常用來檢測線性迴歸是否符合前提假設使用的方法, 若線性迴歸不符合前提假設時, 推論過程中就會產生偏誤, 儘管依舊能計算出線性迴歸模型, 人對於該模型的信任程度隨著不符合前提假設的程度而遞減, 因此本回答將包含三大部分: 1. 「統計」與「機器學習」兩領域的差異 「統計」是一門推論的學問, 建立線性迴歸時透過少量的資料、嚴謹的假設,得到母體可能的特性; 而「機器學習」是在大數據為前提下能有好發揮的領域, 透過大量或近幾乎是「母體」資料建立線性迴歸,而得到母體特性。 例如:有個目標為「全臺灣大學生讀書時間影響考試成績的程度」, 若以統計領域角度,我們僅需要少數資料,但須符合部分線性迴歸的假設; 若以機器學習領域角度,不需要探討線性迴歸是否符合某些前提假設,但需要近幾乎全台灣學生的資料, 才能得出好的模型; 因此我們可以得出結論: 當資料量少又想要有可信任的模型時,以統計角度建立線性迴歸會是比較好的選擇; 若資料量多時,以機器學習角度建立線性迴歸是比較好的選擇。 2. 統計領域中線性迴歸的前提假設 在統計領域中,線性迴歸需要符合以下假設: * 目標值呈現常態分佈 * 每筆資料互相獨立 * 誤差項同質性 * Independent Variable 與目標值具有線性相關 3. 常見的 Residual Analysis * Durbin-Watson test:檢定每筆資料是否獨立 * Bartlett test:檢定誤差項變異數是否同質 * Lack of Fit test:檢定Independent Variable 與 Dependent Variable 是否具有線性相關 * Kolmogrovo-Smirnov test:檢定目標值是否呈現常態分佈 參考資料: https://twgreatdaily.com/1G0hNHMBd4Bm1__YeN_H.html http://web.ncyu.edu.tw/~lanjc/lesson/C7/class/ch03-AN.pdf