预测儿童和青少年高血压:使用机器学习分析预测因素
来源:2024新老澳门原料网站 发布时期:2025年04月10日
背景 儿童和青少年高血压问题日益凸显,给社会和经济带来了沉重负担。因此,早期识别可能导致儿童和青少年发生高血压的危险因素,显得极为关键。本研究尝试并验证了多种机器学习 (machine learning,ML) 算法,以准确预测儿童1年和3年后的血压状态 (包括正常血压、高血压前期和高血压),同时在不影响模型性能的情况下识别重要预测因素。
方法 本研究纳入了中国香港1995-1996学年至2019-2020学年小学一年级至中学六年级的学生 (约6至18岁) 作为人群队列基础。共有36个易于评估的预测因素被用于预测儿童血压的初步建模,涉及的ML算法包括决策树、随机森林、k邻近算法、极端梯度提升和多元逻辑回归等。模型的精准度评估使用了多个相关评价指标。此外,Shapley加性解释 (Shapley Additive exPlanations,SHAP) 被用于识别预测结果中的关键性特征。
结果 本研究中1年和3年血压数据组分别纳入了923 301对和602 179对血压数据。在各ML运算中,XGBoost预测准确度最高,在1年组中宏观受试者工作特征曲线下面积 (area under the receiver operating characteristic curve,AUROC) 达0.92,微观AUROC达0.91,3年组则分别为0.91及0.90。传统的多元逻辑回归法1年组宏观AUROC为0.70,微观AUROC为0.68,3年组分别为0.70及0.68,预测准确性最低。SHAP共识别了17个关键预测因素,这些因素均不涉及血压测量或实验室检测。
结论 ML预测模型无需借助血压测值或实验室检查即可较准确地预测1年和3年后儿童高血压前期和高血压状态。本研究识别出的多个关键预测因素可为高血压个体化预防提供参考依据。