GAN 的训练要注意什么？｜高频面试题解析

60 秒回答模板

GAN 由生成器和判别器对抗训练，最容易出问题的是两者强弱失衡。判别器太强，生成器梯度弱；生成器找到投机模式，会出现 mode collapse。训练时要注意学习率、更新步数、归一化、损失选择、梯度惩罚、谱归一化、噪声输入和数据增强。评估时不要只看 loss，要看生成样本质量、多样性、FID/IS、下游任务收益和人工检查。

考点 对抗平衡

难度 真实面经题

回答目标 讲清方法、取舍和追问

深入解析

先控制对抗平衡

GAN 不是单模型监督训练，生成器和判别器互相博弈。判别器太强或太弱都会让训练信号不稳定，需要控制学习率、更新频率和模型容量。

警惕模式崩溃

Mode collapse 指生成器只产生少数模式，看起来能骗过判别器但多样性很差。可以通过 minibatch discrimination、改进损失、正则和多样性约束缓解。

稳定梯度和归一化

GAN 常见梯度消失、梯度爆炸和震荡。WGAN、梯度惩罚、谱归一化、BatchNorm/LayerNorm 和合适初始化都能改善稳定性。

损失不等于质量

GAN 的 loss 不像普通分类损失那样容易解释。判别器和生成器 loss 的变化不一定直接对应视觉质量或下游效果，必须结合样本检查。

评估看质量和多样性

生成结果要同时看清晰度、多样性、真实性、类别覆盖和下游任务指标。只追求逼真可能牺牲覆盖，导致模型在真实业务中不可用。

易错点

不要把 GAN 训练当成普通监督学习，只看一个 loss 曲线。
不要忽略生成多样性，样本逼真但模式单一仍然是失败。
不要让判别器和生成器更新完全失衡。

面试官追问

判别器太强会怎样？

生成器很难获得有效梯度，训练可能停滞，生成质量难以提升。

WGAN 为什么更稳定？

它用 Wasserstein 距离替代原始 JS 散度，并配合权重裁剪或梯度惩罚改善梯度信号。

如何发现 mode collapse？

观察生成样本是否高度相似，计算多样性指标，并检查各类别或场景覆盖是否不足。