您所在的位置: 成果库 基于多尺度自适应上下文网络的人群计数方法及系统

基于多尺度自适应上下文网络的人群计数方法及系统

成果类型:: 发明专利

发布时间: 2023-10-17 10:16:08

科技成果产业化落地方案
方案提交机构:成果发布人| 涂媛 | 2023-10-17 10:16:08

本发明提供一种基于多尺度自适应上下文网络的人群计数方法及系统,属于机器视觉技术领域,采用经过预训练的VGG‑16网络对人群图像进行初级特征信息提取,获得初级特征图像;采用多个并行排列的自适应卷积网络对初级特征图像进行多尺度上下文信息提取;其中,每个自适应卷积网络用于提取特定尺度上的上下文信息;根据对应尺度上的上下文信息获取人群图像最终的上下文信息;将最终的上下文信息进行解码回归得到最终的密度图;对最终的密度图进行积分计算,得到人群图像上的人群总数。本发明可自适应地捕获多个尺度上的上下文信息,以较小的卷积核获得更大的感受野,降低了计算量,增大了鲁棒性,通过学习自适应地融合多尺度特征信息,提高了计数准确性。

在深度卷积神经网络中,不同尺度的个体可以被具有不同感受野的卷积核捕获。同样特定的感受野通常对应于特定大小的个体。因此在密集的人群场景中,可以通过使用不同的感受野来捕获人群尺度的连续变化。目前常用的方法是并行使用多个不同大小的卷积核来捕获多尺度信息。然而,实验证明,对大尺度的个体使用较大感受野的效果并不是最优的,因为当使用较大内核的卷积核时,模型的参数和计算成本也随之增加了,并且也增加了过拟合的风险。所以为了在不增加模型计算量的情况下获得更大感受野,一些方法在DeepNet中进行了降采样操作,虽然这样获得了更大感受野,但是却降低了特征图的空间分辨率,影响了生成密度图的质量。最近,一些研究开始尝试引入空洞卷积来解决这一问题,与传统卷积相比,空洞卷积可以在不增加额外参数和损失图像分辨率的情况下扩大感受野。例如ASPP使用具有不同空洞率的多个平行空洞卷积来捕获多尺度信息。但实验证明它虽然可以在一定程度上处理尺度变化,但是它在空洞率和尺度变化范围之间很难实现权衡。此外,采用空洞卷积可能会丢失临近信息,较大的空洞率可能导致网格伪影的现象。

人群计数是指预测特定图像中存在的总人数的任务,其在视频监控、交通控制和大都市安全等方面的广泛应用,近年来引起了人们的广泛关注。早期的人群计数主要可分为两类,一种是检测个体的身体或头部,另一种是学习从图像的全局或局部特征到预测计数的映射。但是由于这些方法的局限性,使得它们在复杂的环境无法对人群做到精确的估计。最近,许多研究人员尝试使用卷积神经网络(CNN)进行人群计数,并且得益于卷积神经网络的局部学习能力,目前人群计数的工作不仅可以预测特定图像的人群总数,而且还可以预测人群的空间范围的密度映射。

尽管目前基于CNN的人群计数方法与传统方法相比,计数结果已经得到较大提升,但是由于背景杂乱、密集遮挡和尺度变化等问题的存在,人群计数仍然是一项具有挑战性的任务。其中尺度变化问题是最近人群计数领域最受关注的一个问题。所谓尺度变化是指个体的大小(或人头的大小)随着与摄像机的距离的变化而变化。所以在同一幅图像中会出现不同大小的人群尺度。而不同的尺度会包含不同的特征信息,并且是高度互补的。例如,较高层次的特征编码高级语义,而较低层次的特征包含外观细节。所以如何更好的解决尺度变化问题,并且充分利用丰富的多尺度特征信息成为目前人群计数领域的一个重要课题。

此技术是山东师范大学吕蕾研发,山东师范大学,位于山东省济南市,宗旨和业务范围是“面向社会培养高等学历师资人才,进行成人教育,促进教育事业发展”。

与现有技术相比,本技术的有益效果:采用多个并行排列的自适应卷积模块来自适应地捕获多个尺度上的上下文信息,可有效应对尺度连续变化对人群计数带来的影响,以较小的卷积核获得了更大的感受野,有效降低了计算量,增大了鲁棒性,通过学习如何为每个像素位置权衡这些特征信息,自适应地融合多尺度特征,提高了计数准确性。

技术转让,许可,合作所需资金需双方协商,此项技术想尽快落地保定,希望具备此项技术研发的技术方,能够尽快承接此项目。