真实面经题目 · 原创解析
如何将 GAN 应用到检测分割中以提升性能?
把 GAN 用到检测分割中,核心是让生成器补充样本、域迁移或生成更难的视觉场景,再用检测分割任务损失和对抗损失共同约束,避免只追求图片逼真。
出现于:字节跳动 · 算法
真实面经题目 · 原创解析
把 GAN 用到检测分割中,核心是让生成器补充样本、域迁移或生成更难的视觉场景,再用检测分割任务损失和对抗损失共同约束,避免只追求图片逼真。
我会先明确 GAN 在这里不是替代检测分割模型,而是辅助提升数据和表示。常见做法包括生成稀缺类别或极端场景样本、做风格迁移缩小域差异、做图像增强和缺陷合成,或者用对抗训练让分割 mask 更接近真实分布。训练时要保留检测框、类别和 mask 标签的一致性,同时用 mAP、IoU、召回率和真实线上切片验证是否提升。
GAN 可以放在数据层、特征层或输出约束层。数据层用于合成样本和风格迁移,特征层用于域自适应,输出层可用判别器约束分割结果的形状和边界分布。
如果生成稀缺目标、遮挡场景、低光照或特殊天气样本,必须保证检测框和 mask 与图像内容对齐。标签错位会让检测分割模型学到噪声。
真实业务中训练集和线上场景可能有风格差异,例如摄像头、天气、清晰度、城市或设备不同。GAN 风格迁移可以缩小源域和目标域差距,但要防止改变语义结构。
生成图像看起来真实不代表能提升检测分割。训练目标要结合对抗损失、重建或一致性损失,以及检测分类、框回归和 mask 监督任务损失。
最终以检测和分割指标为准,例如 mAP、IoU、召回率、小目标效果、边界质量和不同场景切片表现。生成样本还要做人审和噪声过滤。
不一定。低质量或标签不一致的合成数据会伤害训练,需要筛选、配比和真实验证。
最怕风格迁移改变了目标形状、边界或类别语义,导致标签仍在但视觉内容不再匹配。
从小比例开始做 ablation,按类别、场景和难例切片观察收益,再逐步调整合成样本权重。