XLRF
目录
前言
在统一的树集成框架中,构建并评估了基于MATLAB的
XGBoost-/LightGBM风格梯度提升模型以及随机森林模型,发布XLRF。XLRF_v1.0
-
在
xgboost-style和lightgbm-style中,代码并未使用原生XGBoost/LightGBM,而是用MATLAB的fitrensemble(LSBoost) + 决策树模板来风格化模拟,只在学习率、轮数、树深/叶子数、行列采样等层面对应原版概念。 -
随机森林采用
TreeBagger,属于MATLAB的标准实现,与原版较为接近。
注意
-
运行MATLAB代码时,应避免在
.m脚本文件名中使用小数点(如XLRF_v1.0.m),建议改为整数或下划线形式(如XLRF_v1.m或XLRF_v1_0.m)。 -
MATLAB只允许文件扩展名使用一个点号,额外的小数点会导致脚本名解析错误,从而引发执行失败。
XLRF_v1.1
- 相比
v1.0,解释性计算使用MATLAB内置重要性:GBDT用predictorImportance;随机森林开启OOBPrediction/OOBPredictorImportance,直接用OOBPermutedPredictorDeltaError。
XLRF_v1.2
- 相比
v1.0,用自写置换重要性来做解释性评估。
XLRF_v2.0
- 在
v1.0前提下,引入了基于验证集的最佳迭代轮数选择:先训练到较大的最大轮数,再用验证集确定最优NumLearningCycles,从而更稳健地控制过拟合。
XLRF_v2.1
- 相比
v2.0,用自写置换重要性来做解释性评估。
小结
- 推荐
XLRF_v1.2>XLRF_v2.1> 其他。