今天的內容會帶大家了解
1. 隨機森林的程式碼應用
2. 用 Scikit-learn 撰寫隨機森林的程式碼
3. 使用內建的特徵重要性進行特徵選取使用 Scikit-learn 撰寫隨機森林 (Random Forest) 模型的程式碼
使用 Sklearn 中的隨機森林:如同決策樹的使用方式,根據不同問題 import 不同的模型
可以看到是從 sklearn.ensemble 這裏 import 的,代表隨機森林是個集成模型
透過多棵複雜的決策樹來投票得到結果,緩解原本決策樹容易過擬和的問題
實務上的結果通常都會比決策樹來得好
隨機森林的模型超參數:同樣是樹的模型,所以像是 max_depth, min_samples_split 都與決策樹相同
可決定要生成數的數量,越多越不容易過擬和,但是運算時間會變長
有了大概的理解之後,我們開始今天的學習吧!!!