目录

XLRF

misaraty 更新 | 2025-12-21
前言
在统一的树集成框架中,构建并评估了基于MATLAB的XGBoost-/LightGBM风格梯度提升模型以及随机森林模型,发布XLRF

XLRF_v1.0

  • xgboost-stylelightgbm-style中,代码并未使用原生XGBoost/LightGBM,而是用MATLAB的fitrensemble(LSBoost) + 决策树模板来风格化模拟,只在学习率、轮数、树深/叶子数、行列采样等层面对应原版概念。

  • 随机森林采用TreeBagger,属于MATLAB的标准实现,与原版较为接近。

注意
  • 运行MATLAB代码时,应避免在.m脚本文件名中使用小数点(如XLRF_v1.0.m),建议改为整数或下划线形式(如XLRF_v1.mXLRF_v1_0.m)。

  • MATLAB只允许文件扩展名使用一个点号,额外的小数点会导致脚本名解析错误,从而引发执行失败。

XLRF_v1.1

  • 相比v1.0,解释性计算使用MATLAB内置重要性:GBDTpredictorImportance;随机森林开启OOBPrediction/OOBPredictorImportance,直接用OOBPermutedPredictorDeltaError

XLRF_v1.2

  • 相比v1.0,用自写置换重要性来做解释性评估。

XLRF_v2.0

  • v1.0前提下,引入了基于验证集的最佳迭代轮数选择:先训练到较大的最大轮数,再用验证集确定最优NumLearningCycles,从而更稳健地控制过拟合。

XLRF_v2.1

  • 相比v2.0,用自写置换重要性来做解释性评估。

小结

  • 推荐XLRF_v1.2 > XLRF_v2.1 > 其他。