本发明提供了一种应变片外观缺陷检测方法及系统,属于基于图像处理的缺陷检测技术领域。根据当前应变片的相机图像数据,判断应变片是否存在缺陷,如判定不存在缺陷,则认定当前应变片为合格品,如判定存在缺陷,则生成缺陷信息以及缺陷对应的第一概率;根据缺陷信息、缺陷信息对应的第一概率以及预训练的强化学习目标网络,生成最优控制动作,所述最优控制动作,包括:执行OCT检测、进行变焦镜头的焦距调节或者同时进行变焦镜头的焦距调节和执行OCT检测;对最优控制动作执行完毕后采集的图像再次进行缺陷检测,得到最终的缺陷检测结果。本发明采用强化学习目标网络生成最优控制动作,实现了对检测效率和检测精度的兼顾。