人工智能在左心室肥厚(LVH)诊断中的主要批评是,这些模型通常表现为黑箱行为(缺乏可解释性),因此人类很难理解为何会产生特定的结果(Hassija 等,2024)。特别是那些固有复杂且缺乏决策过程解释的模型(Hassija 等,2024)。模糊或难以理解的过程会劝阻高水平的医生依赖这种方法。使用易于解释的算法是一种潜在的解决方案。第二个问题是依赖于可用的“软件包”或“现成”的方法,这些方法可能提供“误导性的结果”(Wallace 等,2023)。第三个问题是训练数据集中的过拟合问题。前面已经提到一个AI模型的过拟合问题,但这是所有AI方法的共同担忧。过拟合是指模型在训练集上过于精确地拟合数据,以至于无法准确拟合来自其他来源的数据。构建模型时必须监控过拟合问题。解决这一问题的部分方法是确保每个训练、验证和测试数据集中都包含不同的患者,以提高模型的可靠性(Petmezas 等,2022)。最重要的问题之一是使用广泛且经常不同且有时不可重复的输入变量。这个问题首先可以通过使用相同或不同导联的ECG变量来说明,而没有明确指出所有导联是否重要。
在LVH检测中,多个导联的QRS标准通常提供相似的数据(Rabkin 和 Zhou,2024)。一项研究表明,只有六个肢体导联对于预测LVH的AI模型是必要的(Dwivedi 等,2023),而另一项研究则认为单个导联就足够了(Sato 等,2024)。研究在ECG信号的采样频率上也存在差异。一些研究仅采用小样本方法,而其他研究则使用每条12导联的5000个原始ECG数据点(Kwon 等,2020)。这个问题因临床数据的纳入变化而变得更加复杂,这些数据可能从年龄或性别到广泛的临床和实验室变量,如血细胞计数、血糖、血脂、肾素活性、瘦素、胰岛素、醛固酮和皮质醇(Sabovčik 等,2021)。此外,并非所有出版物都提供了相同的输出以进行比较,例如敏感性、特异性、准确性、F1分数或ROC曲线数据。第四,当各研究中额外的非ECG变量列表如此不同,很难比较和选择“最佳”算法。我之前已经评论过这个问题(Rabkin,2024)。问题必须明确。问题是QRS电压在诊断中的有效性,这是历史上第一次尝试通过心电图识别LVH(Sokolow 和 Lyon,1949),还是我们可以利用ECG信号的所有方面来诊断LVH?后者问题最早由Romhilt和Estes提出,他们增加了QRS轴和ST-T波段来识别LVH(Romhilt 等,1969)。AI模型可以引用Romhilt和Estes的经典方法来证明纳入其他ECG因素的合理性。
然而,纳入广泛的临床和实验室变量进一步偏离了ECG在LVH检测中的实用性,而是旨在回答如何更准确地预测LVH的存在。