科学的特征筛选流程是提升模型预测效率与临床实用性的关键环节。传统预后研究多依赖研究者
以 XGBoost 为代表的集成学习算法在食管癌生存预测中展现出显著优势,为复杂临床数据的处理提供了更优方案。本研究对比了 5 种主流模型的预测效能,发现 XGBoost 模型在 1、3、5 年生存预测中均取得最高 AUC 值(分别为 0.691、0.711、0.712),且 Brier 分数最低(1–5 年波动于 0.155–0.162),其预测准确性和长期稳定性均优于多因素 COX 回归等传统线性模型。这一结果与机器学习在肿瘤预后研究中的整体趋势一致,即集成学习算法能自动捕捉特征间的非线性关系和交互作用,无需手动设定变量关系,更适合处理食管癌预后这种受多因素复杂影响的问题。尽管 LightGBM 模型 5 年 AUC 值达 0.720,单项指标略高,但 XGBoost 在临床决策关键的 DCA 曲线中展现出更优的净效益,在 0.1–0.5 的临床常用阈值范围内持续领先,证明其在平衡过度治疗与治疗不足、辅助临床决策方面更具实用价值,因此被确定为最优预测模型。
理由:
-
“依赖研究者临床经验选择变量” → “依赖研究者
基于临床经验选择变量”
原句语义不通顺,“依赖研究者临床经验”结构模糊,易误解为“依赖研究者”而非“依赖经验”。加入“基于”使逻辑清晰,表达为“依赖研究者基于临床经验作出的选择”,更符合中文表达习惯。 -
数字范围连接符使用错误:“1-5年”、“0.1-0.5”中的短横线应改为 en dash(–)
在正式学术写作中,表示数值范围应使用 en dash(–)而非连字符(-)。虽然视觉上相似,但在排版规范中具有明确区分。此处已修正为“1–5 年”和“0.1–0.5”。 -
其余部分语言通顺、用词准确、逻辑清晰,无明显语法错误或不当表述
- “高重要性特征”“低影响因素”等术语使用恰当;
- 对比分析(如 AUC、Brier score、DCA)表述严谨;
- 算法优势解释合理,因果关系清晰;
- 未发现拼写错误或技术性误用。
综上,仅需对上述两处进行微调以提升语言准确性与学术规范性。