SVM(支持向量机)是由Vapnik及其同事在1990年代初提出的一种方法,通过找到最大化不同类别之间距离的最优线来对数据进行分类(Boser等,1992;Vapnik等,1997)。该方法中的边界被称为最大间隔分类器、最大间隔超平面或N维空间中的最大间隔超平面(Boser等,1992;Vapnik等,1997)。SVM算法可以应用于线性和非线性分类任务。当数据是线性的时,不需要进行转换,但当存在非线性数据时,可以通过使用核函数(如线性核、多项式核、Sigmoid核等)来转换数据,以提高不同类别的分离度(Cervantes等,2020)。这种数据转换的风险在于增加模型的复杂性和过拟合数据。过拟合数据指的是模型对测试数据拟合得过于紧密,以至于无法准确拟合来自其他来源的数据。