2. YOLO V4 目标检测网络
YOLO 一类的单阶段方法使用回归的思想,YOLO 将图像分为 S*S 的网格,将整张图片输入 网络中,直接在输出层对边框进行回归同时输出预测边框内的类别。网格内输出多个预测框 (b-box, bounding box)的信息,信息中包含有 x、y、w、h 和置信度(confidence)五个参 数,其中 x 和 y 是偏移量,w 和 h 是 b-box 的宽和高,这四个参数的值都被归一化到 0-1 之 间。YOLOv4 的网络架构和 YOLOv3 的架构是一样的,包括输入端、主干网络、颈部、预测输出 端四个部分,作者对 CSPResNext50、CSPDarknet53 和 EfficientNet-B3 进行了对比,得到结果 显示 CSPDarknet53 具有更大的感受野,更快的速度,能更好的分离更重要的上下文信息且不会 导致模型推理嘟嘟的下降,所以 YOLOv4 的基础骨架网络使用 CSPDarknet53。