中文摘要:目的 探究胃癌影响因素并构建临床预测模型。方法 收集2020年12月~2023年10月就诊于上海中医药大学附属普陀医院及上海中医药大学附属曙光医院的1000例胃肿瘤患者的临床资料,经数据清洗剔除异常值后,分为胃息肉组(n=487)和胃癌组(n=479)。采用非参数检验筛选出有意义的指标,Lasso回归筛选具有非0系数的胃癌相关特征因素,逐步Logistic回归分析筛选出具有显著相关的因素,构建Lasso-Logistic回归模型,并绘制受试者工作特征(receiver operator characteristic,ROC)曲线计算曲线下面积(area under the curve,AUC)及混淆矩阵评估模型效能。结果 多因素Logistic回归分析结果显示,年龄、白细胞计数(white blood cell,WBC)、单核细胞(monocyte,M)计数、谷丙转氨酶(alanine amiontransferase,ALT)、糖类抗原724(cancer antigen 724,CA724)、糖类抗原242(cancer antigen 242,CA242)、糖类抗原50(cancer antigen 50,CA50)、癌胚抗原(carcinoembryonic antigen,CEA)是胃癌的独立影响因素。基于多因素Logistic回归分析结果构建胃癌的风险预测列线图模型,测试集的AUC为0.91,精准率为100%,召回率为100%,验证集的AUC为0.93,精准率为93.63%,召回率为74.1%,模型预测效果良好。结论 本研究构建8个胃癌常见预测因子,且Lasso-Logistic回归预测模型具有较好区分度,临床可基于患者体检报告,完成胃癌早期筛查。 |