数据预处理一般用 OpenCV 做什么？｜京东算法面经解析

60 秒回答模板

一般会用 OpenCV 做几类事：读取和解码图片、BGR/RGB 和灰度等颜色空间转换；resize、crop、padding、旋转、透视变换等几何处理；归一化、直方图均衡、滤波去噪、锐化、模糊等质量处理；训练阶段做数据增强，例如随机裁剪、翻转、颜色扰动、仿射变换；还可以做边缘、轮廓、阈值分割和标注检查。关键是训练和推理预处理口径要一致，否则模型效果会漂。

考点 格式别搞错

难度 真实面经题

回答目标 讲清方法、取舍和追问

深入解析

基础读取和格式

OpenCV 常用于图像解码、通道转换、灰度化、BGR/RGB 转换、数据类型转换和异常图片过滤。很多模型训练问题来自通道顺序或 dtype 处理错误。

尺寸和几何处理

模型通常要求固定输入尺寸，因此要 resize、center crop、random crop、padding 或 letterbox。检测和分割任务还要同步变换标注框、关键点或 mask。

质量和数值处理

可以做归一化、均值方差标准化、直方图均衡、CLAHE、滤波去噪、锐化和光照校正。这类处理要基于数据问题选择，不能为了处理而处理。

数据增强

训练阶段常用翻转、旋转、缩放、仿射变换、颜色扰动、模糊和噪声模拟提升泛化。增强策略要符合真实业务分布，避免生成不合理样本。

一致性和性能

上线推理必须复用同样的 resize、归一化、通道顺序和裁剪规则。批处理、缓存、并行解码和硬件加速会影响训练吞吐和线上延迟。

易错点

不要忘记 OpenCV 默认 BGR，通道错会让模型输入分布异常。
不要只处理图片不处理标注，检测分割任务必须同步变换标签。
不要把训练增强原样用于推理，推理通常只保留确定性预处理。
不要忽略线上一致性，离线预处理和服务端预处理必须对齐。

面试官追问

OpenCV 读取图片默认是什么通道顺序？

默认是 BGR，而很多深度学习模型或可视化库使用 RGB，因此经常需要显式转换。

检测任务 resize 时要注意什么？

图像缩放、padding 或裁剪后，bounding box、mask 和关键点坐标必须同步变换，否则标签会错位。

数据增强是不是越多越好？

不是。增强要符合真实场景，过强或不合理增强会改变标签语义，导致模型学到错误分布。