Day 37 Logistic Regression問題
各位前輩,大家好。兩個問題想要請前輩協助:
問題1.
Day 37 的鳶尾花案例(Logistic Regression):
logreg.intercept_ 出來的值為:
array([ 0.26285844, 0.90894772, -1.13916732])
logreg.coef_ 出來的值為:
array([[ 0.39499237, 1.4386022 , -2.22463256, -1.00282673], [ 0.53629446, -1.7168245 , 0.60579622, -1.53895099], [-1.73926827, -1.41643016, 2.44033956, 2.53159177]])
column name = ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
顯示有三條的Boundary在這個案例中。
以第一條界線來說,寫成方程式後為
y = 0.26285844 + 0.39499237*'sepal length (cm)'+1.4386022*'sepal width (cm)'+-2.22463256*'petal length (cm)'+-1.00282673*'petal width (cm)'
以上敘述不知是否正確?謝謝。
問題2.
Day 37 的補充資料中 https://reurl.cc/QGqEo
有提到Logistic Regression的優點:
1.資料不需要線性可分
2.可以獲得A類跟B類的機率
3.實務上Logistic Regression執行速度非常快
第1點提到: 資料不需要線性可分。想請問一下原因是: 因為Logistic 可以畫出多組Boundary。所以畫出來的boundary可能可以有效地切割非線性可分的資料嗎?還是另有含意? 謝謝。
回答列表
-
2019/05/29 下午 11:17Jimmy贊同數:0不贊同數:0留言數:0
Hi 汶修!
問題1 是正確的喔! 那條線其實是一個平面,會盡可能的將資料點切開來,不過當超過特徵維度超過 3 維時,我們就沒辦法透過資料視覺化來實際把 邊界的線畫出來了。
問題2 也是沒錯的! 你可以看一下這個影片,後段有提到 non-linear 的 boundary,證明 logistic regression 是可以生成非線性的邊界的
-
2019/05/31 上午 10:12張維元 (WeiYuan)贊同數:0不贊同數:0留言數:0
32
關於問題二,補充兩張圖作解釋:
1. Logistic 其實是將 Linear Regression 轉換到 1/0 的兩種可能中。
2. 因此他的公式會變成像一個多項式回歸的樣子,畫出來就會像是下圖這樣有曲折,也可以處理非線性的資料。