YOLO

统一网络: 将目标检测的所有步骤（特征提取、边界框预测、类别预测）整合到一个单一的 <a class="internal-link" target="" data-note-icon="" href="/人工智能/深度学习/卷积神经网络/">CNN 中。
端到端训练: 模型直接从图像像素到最终的检测结果进行端到端训练。
全局信息: 在预测时，YOLO能够看到整个图像，这有助于减少背景误检。

You Only Look Once
基于深度学习的实时目标检测算法：只需要一次前向传播（一次看图）就能完成图像中所有物体的定位和分类

它将目标检测任务转化为一个回归问题，通过单个神经网络直接从图像像素预测目标的边界框和类别概率，从而实现了极快的检测速度，使其能够进行实时目标检测。

输入处理
- 将输入图像调整为固定大小（例如 448x448）
- 标准化像素值
划分网格：将图像划分成 S×S 个网格（例如7×7）
每个网格预测
- B个边界框（Bounding Boxes）
- 每个框包括位置 (x, y, w, h) + 置信度 (confidence)
- C个类别概率

预测输出：

\begin{array}{r} S \times S \times (B \times 5 + C) \end{array}

版本	发布年份	主要特点
YOLOv1	2016	提出统一检测框架，实时检测
YOLOv2（YOLO9000）	2017	引入Anchor机制，提高准确率，可以检测9000类
YOLOv3	2018	使用多尺度预测，特征提取更强（Darknet-53）
YOLOv4	2020	优化训练技巧（Bag of Freebies/ Specials），提升性能
YOLOv5（社区版）	2020	PyTorch重写，更轻便，工程实用性强
YOLOv6	2022	更偏工业部署，速度更快
YOLOv7	2022	多任务学习，统一多个检测任务
YOLOv8	2023	不再依赖Darknet，模块化设计，更快更准，支持分割任务