中国卒中杂志 ›› 2024, Vol. 19 ›› Issue (6): 632-639.DOI: 10.3969/j.issn.1673-5765.2024.06.004
尚媛媛1,杜正静2,陈静怡3,彭波2,龙杰琦1
SHANG Yuanyuan1, DU Zhengjing2, CHEN Jingyi3, PENG Bo2, LONG Jieqi1
摘要: 目的 探讨心脑血管疾病的发病状况和气象因素之间的关系,运用机器学习方法预测心脑血管疾病发病风险等级,为疾病防控提供科学依据。
方法 以贵州省疾病预防控制中心提供的心脑血管疾病患者为研究对象,通过相关性分析确定模型的预测因子,分别基于支持向量机、极端梯度提升、轻量级梯度提升机、随机森林这4种机器学习模型构建心脑血管疾病发病风险的预测模型。将纳入患者以8∶2的比例分为训练集和测试集。训练集用于模型训练和参数优化,测试集用于评价模型效果。主要以准确率来评价各模型的预测效果。
结果 本研究共纳入60岁以上心脑血管疾病患者16 383例,其中女性6507例,且日发病例数表现为不平衡数据,其中诊断类型包括急性心肌梗死、卒中、心绞痛、心源性猝死。日发病例数与气压、气温、湿度3大类26种气象因素存在相关性,与气压、相对湿度呈正相关,与气温呈负相关。采用GridSearchCV函数找出最优权重的配比后,使用机器学习方法构建模型,并通过测试集验证输出模型指标参数。轻量级梯度提升机模型在预测任务中表现最佳,准确率达到85.68%,精确率为82.56%,召回率为85.68%,F1分数为79.56%(均P<0.05)。心脑血管疾病患者发病前72 h气温的INP值为63 814,是影响日发病例数最重要的气象因素,排名第2和第3的是发病前48 h气温和发病前24 h气温,对应INP值分别为62 002、43 216。
结论 基于机器学习方法建立的心脑血管疾病发病预测模型具有较高的预测价值,其中轻量级梯度提升机模型的预测效果最好。
中图分类号: