logo
Loading...

隨機森林擬合出來的 leaf encoding 可以怎麼解釋? - Cupoy

如題,先建立隨機森林並且打印 train_X 的 dimension: rf = RandomFor...

ml100,ml100-d32

隨機森林擬合出來的 leaf encoding 可以怎麼解釋?

2020/06/14 07:56 下午
機器學習共學討論版
Yang Wang
觀看數:12
回答數:6
收藏數:0
ml100
ml100-d32

如題,先建立隨機森林並且打印 train_X 的 dimension: ```python rf = RandomForestClassifier(n_estimators=20, min_samples_split=10, min_samples_leaf=5, max_features=4, max_depth=3, bootstrap=True) print("Train Feature Size: {}".format(train_X.shape)) ``` 這時候再打印以下這段: ```python for i in range(5): print(rf.apply(train_X)[i]) ``` 會出現 ```console [11 6 4 10 11 10 14 4 11 11 3 10 9 10 6 9 11 11 6 12] [ 4 10 10 7 6 6 3 8 4 6 13 6 4 7 11 4 4 3 11 6] [ 4 10 10 7 6 3 4 8 6 7 13 6 5 7 10 4 4 3 10 6] [11 14 13 13 7 14 6 11 6 7 14 6 12 14 11 5 13 8 10 11] [ 2 4 6 3 6 4 3 5 10 10 4 13 2 3 7 9 6 4 13 3] ``` 我只能理解到 rf.apply(train_X) 的 dimension 會是 (222, 20)。因為 train_X 的樣本數為 222,然後 n_estimators 設為 20。 但是 rf.apply(train_X) 出來的這個 series 有什麼意義嗎?可以怎麼解釋?