遇到同時有連續型及類別型變數的情況會如何做資料前處理?若要使用年齡來比較變數重要性,利用類別編碼進行轉換,適合randomforestclassifier去做分析嗎
2020/03/02 03:24 上午
機器學習共學討論版
lee2nd116
觀看數:7
回答數:2
收藏數:0
助教您好:
在閱讀講義pdf後,想知道若是要做監督式學習,擁有結構化資料,以隨機森林做分析為例子,資料的變數同時有實數及類別變數。
(1)一般而言遇到同時有連續型及類別型變數的情況會如何做資料前處理
(2)若是要同時比較變數重要性,如果將實數變數做recode的動作,像是年齡16~25重新定義成code1、年齡26~30重新定義成code2...,再統一用randomforestclassifier去做分析,是合適的方法嗎