logo
Loading...

迴歸分析在統計學與機器學習是否不同??? - Cupoy

各位老師專家大大 大家好:這標題我不知道這樣問有沒有很奇怪我會這樣問是因為我看像吳恩達老師的課程ht...

迴歸分析在統計學與機器學習是否不同???

2022/12/06 下午 03:50
regression model 程式碼撰寫
鈞仔
觀看數:7
回答數:1
收藏數:0

各位老師專家大大 大家好: 這標題我不知道這樣問有沒有很奇怪 我會這樣問是因為 我看像吳恩達老師的課程 https://youtu.be/F6GSRDoB-Cg 甚至很多很多機器學習教材 都有教Gradient Descent 在Linear regression的用法 (當然也有可能是我的統計系老師覺得太難 不教跳過 這也有可能) 可是我是統計系的畢業的 怎我只有學過最小平方法 然後就可以求係數了 2參數複回歸 頂多有教怎麼用矩陣計算求得 多元複回歸老師就用R/SAS來跑 畫面呈現教學 我不知清楚 是不是因為我不熟Python造成 我有點混亂 我的問題還是想問 迴歸分析在統計學與機器學習是否不同??

回答列表

  • 2023/01/12 下午 00:57
    王健安
    贊同數:1
    不贊同數:0
    留言數:1

    鈞仔 您好, 的確有些方法在統計學領域已經是代表性方法, 卻在機器學習興起時直接被延伸使用, 那迴歸分析在統計學領域與機器學習領域的不同, 我認為有以下數點: 1. 係數證明方式:統計學會使用 LSE 或 MLE 證明係數計算公式,屬於「公式解」,而機器學習使用Gradient Descent 或其他最佳化方法,屬於「數值解」;在資料集相同下,公式解的結果一定會一樣,但數值解的結果不一定一樣。 2. 前提假設的嚴格程度:統計學很要求使用上的前提假設,例如:迴歸分析就要符合「依變數為常態分布」、「自變數與依變數要是線性關係」、「自變數與依變數的變異數相等」等要求,而機器學習不需要符合這些假設。 3. 是否在意資料量與特徵數:在統計學為了進行檢定以確認迴歸分析有效性,會進行 ANOVA ,其中 SSE 的自由度正好是資料量減掉特徵數,換句話說當特徵數大於資料量時,ANOVA 會無意義,導致無法確認該迴歸的有效性;而機器學習沒有這樣的考量。 4. 誤差估計:統計學會針對每個計算出來的結果給予誤差範圍,這在認知到模型上線前與上線後結果截然不同的現代是很有需求的工具,但機器學習僅能夠過現有資料配適出一個模型,無法確認計算出來的誤差值。