60 秒回答模板

核函数的作用是把原空间样本映射到高维特征空间后计算内积,但计算时不一定显式构造高维向量。常见核函数有线性核,适合线性可分或高维稀疏特征;多项式核,可以建模特征交互;RBF 高斯核,能表达局部非线性关系,是 SVM 中很常用的核;Sigmoid 核形式类似神经网络激活,但需要参数满足条件。选择时要看数据规模、维度、非线性程度和过拟合风险。

考点 核技巧
难度 真实面经题
回答目标 讲清方法、取舍和追问

深入解析

01

先说明核技巧

核函数不是简单的相似度名字,而是满足一定条件的函数,用来直接计算映射后特征空间的内积,从而避免显式构造高维甚至无限维特征。

02

线性核适合简单场景

线性核就是原空间内积,参数少、速度快、可解释性较好。文本分类这类高维稀疏场景中,线性核往往已经有不错效果。

03

多项式核建模交互

多项式核可以表示不同阶数的特征组合,适合存在有限阶特征交互的任务。但阶数过高会增加复杂度,也更容易过拟合。

04

RBF 核表达非线性

RBF 高斯核基于样本距离度量局部相似性,表达能力强,常用于非线性分类。关键参数 gamma 会影响决策边界的平滑程度。

05

选择核函数看数据

样本量大、维度高时优先考虑线性核或近似方法;非线性明显且样本规模可控时可尝试 RBF;选择时要配合交叉验证调 C、gamma、degree 等参数。

易错点

  • 不要只列名字,要解释核函数和高维映射内积的关系。
  • 不要认为 RBF 一定最好,样本规模、维度和过拟合风险都要考虑。
  • 不要忽略核函数参数,参数不合适会直接影响分类边界。

面试官追问

RBF 核的 gamma 有什么影响?

gamma 越大,单个样本影响范围越小,边界更复杂;gamma 越小,影响范围更大,边界更平滑。

什么时候用线性核?

当数据近似线性可分、维度高、样本大或需要更快训练推理时,线性核更合适。

核函数需要满足什么条件?

常见要求是对应的 Gram 矩阵半正定,也就是满足 Mercer 条件,才能表示某个特征空间的内积。