logo
Loading...

Day 37 Logistic Regression問題 - Cupoy

各位前輩,大家好。兩個問題想要請前輩協助:問題1.Day 37 的鳶尾花案例(Logistic Re...

ml100-2,ml100-2-d37

Day 37 Logistic Regression問題

2019/05/24 下午 06:05
機器學習共學討論版
蔡汶修
觀看數:15
回答數:2
收藏數:0
ml100-2
ml100-2-d37

各位前輩,大家好。兩個問題想要請前輩協助:


問題1.

Day 37 的鳶尾花案例(Logistic Regression):

logreg.intercept_ 出來的值為:

array([ 0.26285844,  0.90894772, -1.13916732])


logreg.coef_ 出來的值為:

array([[ 0.39499237,  1.4386022 , -2.22463256, -1.00282673],        [ 0.53629446, -1.7168245 ,  0.60579622, -1.53895099],        [-1.73926827, -1.41643016,  2.44033956,  2.53159177]])


column name = ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']


顯示有三條的Boundary在這個案例中。

以第一條界線來說,寫成方程式後為

 y = 0.26285844 + 0.39499237*'sepal length (cm)'+1.4386022*'sepal width (cm)'+-2.22463256*'petal length (cm)'+-1.00282673*'petal width (cm)'


以上敘述不知是否正確?謝謝。


問題2.

Day 37 的補充資料中 https://reurl.cc/QGqEo

有提到Logistic Regression的優點:  

1.資料不需要線性可分  

2.可以獲得A類跟B類的機率  

3.實務上Logistic Regression執行速度非常快


第1點提到: 資料不需要線性可分。想請問一下原因是: 因為Logistic 可以畫出多組Boundary。所以畫出來的boundary可能可以有效地切割非線性可分的資料嗎?還是另有含意? 謝謝。

回答列表

  • 2019/05/29 下午 11:17
    Jimmy
    贊同數:0
    不贊同數:0
    留言數:0

    Hi 汶修!


    問題1 是正確的喔! 那條線其實是一個平面,會盡可能的將資料點切開來,不過當超過特徵維度超過 3 維時,我們就沒辦法透過資料視覺化來實際把 邊界的線畫出來了。


    問題2 也是沒錯的! 你可以看一下這個影片,後段有提到 non-linear 的 boundary,證明 logistic regression 是可以生成非線性的邊界的

  • 2019/05/31 上午 10:12
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:0

    32

    關於問題二,補充兩張圖作解釋:


    1. Logistic 其實是將 Linear Regression 轉換到 1/0 的兩種可能中。

    2. 因此他的公式會變成像一個多項式回歸的樣子,畫出來就會像是下圖這樣有曲折,也可以處理非線性的資料。