目标定位
pc表示是否是物体(前三个中的一个)
b表示位置(坐标+高宽)
c表示哪一类
特征点检测
output:输出点坐标
目标检测
先剪裁出来训练网络是否检测出来(0,1),然后用滑动窗口遍历进行检测。缺点:计算成本,粗细粒度会影响效果。
卷积的滑动窗口实现
用卷积实现fc:
将他们作为一张图片输入给卷积网络进行计算,有很多公共区域可以共享很多计算
Bouding box检测
YOLO:更加精细
取框的中点,属于哪个区域就分给哪个。如果有的话pc=1,bx,by是中点相对于这个格子的位置,必须处于01之间,bw,bh是相对于格子的比例,可以大于1。
交并比 IoU
看检测出来的框和实际的框,衡量精确度
非极大值抑制
检测出来多个格子都有物体:
pc输出概率,取最大pc概率的框,逐一审视其他的框,抑制IoU很大的框
对于单个检测:
如果是多个物体检测,需要每个输出类别都独立做一次非极大值抑制、
Anchor Boxes
一个格子检测多个对象
被分配到(grid cell, anchor box pair)
YOLO