700字范文 > 基于dota的目标检测（旋转框）论文阅读Oriented Object Detection in Aerial Ima

基于dota的目标检测（旋转框）论文阅读Oriented Object Detection in Aerial Ima

时间：2018-07-19 10:22:43

基于dota的目标检测（旋转框）|论文阅读Oriented Object Detection in Aerial Images with Box Boundary-Aware Vectors

文章目录

基于dota的目标检测（旋转框）|论文阅读Oriented Object Detection in Aerial Images with Box Boundary-Aware Vectors1.Introducion2 Approach具体结构剖析：heatmapoffsetBox ParametersOrientation(定向)3 ExperimentsConclusion

1.Introducion

本文介绍了基于检测对象的中心关键点并在此基础上回归盒子边界感知向量(BBAVectors)以捕获定向的边界盒子的目标检测方法。

-----------周的CenteNet提出在没有分组过程的情况下回归中心点处的边界框的宽度和高度，本文推测周的CenteNet可以通过学习一个额外的角度θ以及w和h来扩展到面向对象检测任务，但是由于参数w和h是针对每个任意定向的对象在不同的旋转坐标系中测量的，联合学习难度极大

由此受到启发，通过学习盒边界感知向量(BBA矢量)来捕捉对象的旋转边界盒。BBA矢量分布在笛卡尔坐标系的四个象限。

基于本文的方法可以对所有任意定向的物体，学习盒边界感知向量（BBA矢量）来捕捉对象的旋转边界盒【BBA矢量在同一笛卡尔坐标系中测量】

针对矢量非常接近象限的边界，网络将难以区分矢量类型的问题，本文提出把定向包围盒(OBB)分成两类（即水平边界框(HBB)和旋转边界框(RBB)），分别处理。

（a）是基于周的Centernet拓展的基线法，（b）是本文的提出的学习盒边界感知向量的方法。从上图明显可见在检测对象的方位变化，（a）需要建立新的旋转坐标系测量（b）任何物体均处在同一个笛卡尔坐标系

2 Approach

图解：

上图描述的具体过程是：

输入图像进入主干网络顶部，（1）上采样（2）通过一个3 × 3的卷积层对上采样的特征图进行细化热图(P ∈ RK×H s×W s)、偏移(O ∈ R2×H s×W s)、盒参数(B ∈ R10×H s×W s)、方向图(α ∈ R1×H s×W s)（3）特征图与浅层连接，然后通过1 × 1卷积层，在潜在层中使用批量标准化和ReLU激活，最终输出

具体结构剖析：

输入图像通过双线性插值将深层向上采样到与浅层相同的大小，通过跳跃连接将深层和浅层结合起来，通过一个3 × 3的卷积层对上采样的特征图进行细化。然后，细化的特征图与浅层连接，通过1 × 1卷积层，以细化信道特征。在潜在层中使用批量标准化和ReLU激活。

假设一幅输入RGB图像为I ∈ R3×H×W，其中H和W为图像的高度和宽度。然后将输出的特征图X ∈ RC×H s×W s(本文中C = 256)转化为四个分支:热图(P ∈ RK×H s×W s)、偏移(O ∈ R2×H s×W s)、盒参数(B ∈ R10×H s×W s)、方向图(α ∈ R1×H s×W s)，其中K为数据集类别数，s = 4为比例尺。该变换由两个3 × 3核的卷积层和256个信道实现。