logo
Loading...

學習機器學習過程中面臨的問題 - Cupoy

課程上到現在一直會有一個疑問,就是在課程中對於一些統計的理論感覺會比較少具體的說明,例如可能會不太知...

ml100-2-d30,ml100-2

學習機器學習過程中面臨的問題

2019/06/24 下午 05:18
機器學習共學討論版
梁記瑋
觀看數:42
回答數:3
收藏數:0
ml100-2-d30
ml100-2

課程上到現在一直會有一個疑問,

就是在課程中對於一些統計的理論感覺會比較少具體的說明,


例如可能會不太知道Leaf Encoding、Gradient Boost Decision Tree、Random Forest等的具體意義跟他到底裡面做了什麼,


而上網做查詢通常又會出現大量艱澀的統計跟數學,

(像是參考資料就是這類的情況,感覺裡面有許多的東西可能已經站在前一個理論的肩膀,因此會有一種要看懂的話需要很多的知識儲備,但是因為內容廣也無從補起)


所以很多的練習對使用者來說就是整理出Function所需的格式之後丟進去,然後會得到一個分數,相關係數高就是好,低就是不好,但卻不知道裡面黑盒子在做什麼,如果結果不理想問題又在哪裡?


還是其實現在資料科學家中不太需要去研究這些部分呢?


以上是目前學習上的困難跟心中的疑惑,懇請解惑

回答列表

  • 2019/06/25 下午 05:37
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:1

    我先回復幾點我的想法:


    1. 以學習的過程來說,會件事「先會用」再「研究內容」。對於初學而言,是可以把這些模型先當成黑盒子來做使用即可。至於背後的原理跟數學可以放在第二階段。


    2. 實務上只看結果來作挑選模型也是一種方法,因為實際上不是每一種模型都有好的可解釋性。

  • 2019/06/27 下午 00:32
    Jimmy
    贊同數:4
    不贊同數:0
    留言數:2

    Hi 記瑋!


    如果你想成為一位資料科學家,這些知識背後的含義你都應該要能夠了解,因為身為資料科學家,你必須了解手中的武器 (模型) 是如何運作的,在實際打怪 (做專案時) 才知道如何使用,遇到困難才能知道問題出在哪裡。


    當然現在有很多套件,變成只要套套工具就可以得到結果,這樣的好處是對於初學者,或是僅是想要體驗資料科學威力的人來說會變得很容易。


    結論是你應該要知道自己學習這些知識的目標是什麼?如果只是想要多一些工具,那知道怎麼套用即可。但如果未來是想成為一名真正的資料科學家,那這些知識你就應該要一步一步的累積起來,而且這些知識隨時都在進步,持續的補充新知對資料科學家也非常的重要喔!

  • 2019/07/15 上午 10:14
    張維元 (WeiYuan)
    贊同數:1
    不贊同數:0
    留言數:0

    了解,感謝回答,那請問是否相關的理論是放在後面的課程會再詳細說明呢? 如果沒有的話,是否會有一些理論相關學習的Road Map呢? 因為以我目前的理解可能數學部分會參雜到微積分、機率統計與線性代數等等


    建議可以找一門線上課程(大學的開放式課程)學習,通常這種會談比較理論的部分。坊間比較實作的課程多半會以「怎麼用」為主。