中国卒中杂志 ›› 2022, Vol. 17 ›› Issue (03): 265-271.DOI: 10.3969/j.issn.1673-5765.2022.03.008
陈思玎, 俞蔚然, 黄馨莹, 刘欢, 姜勇, 王拥军,
摘要:
目的 建立基于机器学习算法的新发急性缺血性卒中(acute ischemic stroke,AIS)患者1年预后的预测模型,为相关研究和临床工作提供借鉴。
方法 以中国国家卒中登记(China national stoke registry,CNSR)数据库中的新发AIS患者为研究对象,通过logistic回归模型确定进入模型的预测因子,分别基于机器学习[CatBoost模型、XGBoost模型、梯度提升决策树(gradient boosted decision trees,GBDT)模型、随机森林模型]和传统logistic回归模型构建新发AIS患者1年预后不良(mRS≥3分)的预测模型。将入组患者按照7∶3的比例随机分为训练集和测试集。训练集用于模型训练和参数优化,测试集用于评价模型效果。评价各模型预测预后不良效能 的区分度指标主要是AUC,校准度指标为Brier分数。
结果 共纳入8230例新发AIS患者,平均64.4±12.8岁,其中女性3113例,1年预后不良患者2360 例。针对训练集的logistic回归结果显示,年龄、女性、卒中前mRS≥3分、入院和出院时NIHSS、肢体运 动功能障碍、周围血管病史、入院血糖、调节血脂药物(出院带药)、抗血小板药(1年服药依从)可 作为1年预后不良的预测因子。Catboost、XGBoost、GBDT、随机森林及logistic回归模型预测新发AIS患者1年功能预后的AUC分别为0.857(0.850~0.864)、0.856(0.850~0.863)、0.856(0.848~0.864)、 0.853(0.846~0.859)和0.846(0.837~0.855)。Catboost(P =0.0130)、XGBoost(P =0.0133)、GBDT (P =0.0229)和随机森林(P =0.0429)等机器学习模型的预测效能均优于logistic回归模型;所有预测模型的校准度均良好。
结论 基于机器学习算法建立的新发AIS患者1年功能预后预测模型具有较高的预测价值,其中 Catboost模型的预测效果最好。