(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210211299.X
(22)申请日 2022.03.05
(71)申请人 华东理工大 学
地址 200237 上海市徐汇区梅陇路13 0号
(72)发明人 陈志华 嵇恒铭 周宇 王子涵
张景轩
(51)Int.Cl.
G06T 7/00(2017.01)
G06T 7/70(2017.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种基于语义特征注意力融合的划线停车
位检测方法
(57)摘要
本发明涉及视频图像处理技术领域, 提供了
一种基于语义特征注意力融合的划线停车位检
测方法, 所述方法包括步骤: a.使用主干网络提
取停车位图像的初始特征信息; b.使用特征注意
融合模块对初始特性信息进行特征融合, 得到融
合特征; c.在融合特征上使用候选区域生成 网络
(RPN)生成候选区域特征; d.使用目标检测器对
候选区域进行检测, 直接得到图像中划线停车位
目标的四个角点坐标信息。 本发 明实施例提供的
基于语义特征注意力融合的划线停车位检测方
法可以有效地提高划线停车位检测的平均精度
并具有较高的鲁棒 性。
权利要求书2页 说明书4页 附图2页
CN 114764785 A
2022.07.19
CN 114764785 A
1.一种基于语义特 征注意力融合的划线停车位检测方法, 其特 征在于, 包括以下步骤:
步骤S1: 提供待检测的划线停车位图像, 并对所述的划线停车位图像进行主干网络特
征提取, 获取相应的映射特 征。
步骤S2: 搭建语义特征注意力 融合网络模块, 所述网络模块包括全局平均池化层和卷
积层; 将S1得到映射特 征输入到语义特 征注意力融合网络模块中, 得到融合特 征。
步骤S3: 搭建RPN网络层和ROI层, 所述RPN网络包含分类模块和回归模块; 将S2中得到
的融合特征输入到RPN网络中, 得到初步的候选区域框, 使用ROI层将候选区域框和S2 中的
融合特征映射为候选区域特 征。
步骤S4: 搭建目标检测器, 所述目标检测器包括全连接层和预测头; 将S3中得到的候选
区域特征输入到目标检测器中, 得到划线停车位检测结果, 结果的形式为图像中划线停车
位目标的四个角点 坐标值。
2.根据权利要求1所述的方法, 其特征在于, 所述步骤S1使用ResNet101网络和特征金
字塔结构提取图像的多层残差映射特 征, 并用R 1‑Conv1~5表示。
3.根据权利要求1所述的方法, 其特征在于, 所述步骤S2的语义特征注意力融合模块在
整个划线停车位检测网络中共有4个, 每个语义特征注意力融合模块有两个输入, 其中一个
输入是R1‑Conv‑5, 另外一个输入在四个 语义特征注意力融合模块中分别为R 1‑Conv‑1~4。
4.根据权利要求3所述的方法, 其特征在于, 所述的语义特征注意力融合模块由卷积
层, 全局平均池化和激活函数组成, 可以表示 为:
其中
上述公式中Y即R1 ‑Conv‑5, X在四个语义特征注意力融合模块中分别为R1 ‑Conv‑1~4,
Z是语义特征注意力融合模块中的输出特征, σ1是Sigmoid激活函数, σ2是ReLU激活函数,
表示矩阵中对应元素直接相乘,
表示矩阵相加,
表示为卷积操作, 其中卷积核 的
大小为3×3, 通道数从c变为c/r,
同样也表示为卷积操作, 并且卷积核大小为1 ×1,
通道数从c /r变为c, AvgPo ol表示为全局平均池化。
5.根据权利要求1所述的方法, 其特征在于, 所述步骤S4中目标检测器的预测头 中直接
输出与图像中划线停车位四个车位角点相关的参数, 经过转化之后, 可以直接得到四个车
位角点的坐标值。
6.根据权利要求5所述的方法, 其特征在于, 所述的预测头的输出参数为 x,y,w,h, α1, α2,
α3, α4, 其中x,y是矩形框的中心点, w,h分别是矩形框的宽和高, 通过以上四个参数x,y,w,h可
以得到预测矩形框的四个顶点, 设矩形框的四个顶点分别a,b,c,d, 四个顶点a,b,c,d的坐标
可以分别表示为
权 利 要 求 书 1/2 页
2
CN 114764785 A
2设矩形框的中心点为O, 则划线停车位线 四个顶点a,b,c,d与中心点O连线的角度值分别为
α1, α2, α3, α4。权 利 要 求 书 2/2 页
3
CN 114764785 A
3
专利 一种基于语义特征注意力融合的划线停车位检测方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 01:17:50上传分享