CVPR2016为啥这么受瞩目柔软
偏方秘方 2020年04月05日 浏览:1 次
CVPR 18 论文解读:基于空洞卷积神经络的高密度人群理解方法
(公众号:) AI 科技评论按:本文作者为美国伊利诺伊大学(UIUC)张晓帆,他为 AI 科技评论撰写了基于 CVPR 录用论文《CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes》的独家解读稿件,未经许可不得转载。
论文地址:
来自北京邮电大学和美国伊利诺伊大学(UIUC)的研究者们提出一种适用于密集人群计数的空洞卷积神经络模型 CSRNet。该络模型摆脱以往广泛应用于人群计数的多通道卷积络方案,在大幅削减络参数量和络训练难度的同时,显著提升了人群计数的精度和人群分布密度图的还原度。该研究已被 CVPR 2018 接收。
人群计数和人群密度估计有着重要的安防应用场景。随着城市人口的日益增长,在地铁站,商场,各种节日集会中,超额聚集的人群带来潜在危险,极容易造成踩踏、骚乱等悲剧。因此,人群计数和人群的密度分布估计成为安防领域的热门课题。近年来,人群计数的算法性能在与深度学习的结合下得到了很大的提升。
人群计数的目的是找出特定场景中的人数,而人群密度分布估计需要获取空间密度信息和人数(密度图求和)。人群计数的难点在于,场景的变化跨度大,目标的尺度变化不尽相同,人和人、人和景物之间存在不同程度的遮挡等等。如图 1 所示
,三张图均包含了 95 人,但是他们的空间分布完全不同。
图 1 人群计数场景
作者研究发现,被广泛运用在人群计数上的多通道卷积络(MCNN)存在着结构冗余、参数繁多、训练困难的局限性。此类多通道卷积络在不同通道上采取大小不等感受域的卷积络,以适应不同场景(如高、中、低密集程度)的人群计数需要。但研究发现,不同通道学习到的特征重合度很高(图 2),并没有因场景密集程度不同而出现明显差异。多通道络表现冗余。为作对比,作者采用一个参数更少、更深层、更易训练的单通道卷积络(A deeper CNN),获得比多通道络更好的效果(表 1)。
图 2 多通道卷积络中的大、中、小通道在 ShanghaiTech PartA 中的测试表现相似
表 1 更深的单通道卷积络使用较少参数却在 ShanghaiTech PartA 中获得更小误差
此外,作者为了避免过度使用降采样而导致密度图的分辨率损失,在络的后半部分引入了空洞卷积层,利用空洞卷积增大感受域并维持分辨率(图 3),并提出 CSRNet 络模型(表 2)。CSRNet 后端四组不同的配置在 ShanghaiTech PartA 中性能测试如表 3。
图 3 使用卷积+池化+上采样(上)与空洞卷积(下)输出同样分辨率图像,空洞卷积可保留更多图像细节
表 2 CSRNet 络结构,卷积以参数命名为(conv kernel size – channel – dilation rate)
表 3 CSRNet 的四种后端配置在人群计数中精度对比,其中方案 B 精度最高
由于采用比多通道络更简单的结构,CSRNet 在训练时可直接采用端到端训练并快速复现实验结果,也可利用迁移学习提高训练效果。得益于简单、规整的络结构,CSRNet 对硬件实现更加友好,可以高效地部署在物联设备中。
实验表明,CSRNet 在四个公开人群数据集(ShanghaiTech dataset、the UCF CC 50 dataset、the WorldEXPO10 dataset、the UCSD dataset)和一个车辆数据集(TRANCOS dataset)上均达到了最高水平的精确度(State-of-the-art Performance),详见表 4 至表 8。
表 4 ShanghaiTech 数据集测试结果
表 5 UCF CC 50 数据集测试结果
表 6 WorldExpo 10 数据集测试结果
表 7 UCSD 数据集测试结果
表 8 TRANCOS 数据集测试结果
原创文章,未经授权禁止转载。详情见转载须知。
心梗不治疗能好吗
怎么治疗血栓
柳州十佳白癜风医院
双下肢水肿的饮食原则中老年妇女肾虚的症状有哪些?
肩颈背部酸痛怎么锻炼

- 上一篇: p简单装修留下布置余地不刻意寻求风格是关缘由
- 下一篇 OFweek网讯中国缘由
-
中国瑞典赛中国10人折戟资格赛马龙退赛樊振东
2020-09-10
-
慢性支气管炎的自我按摩1
2019-07-16
-
中医提醒不吃早餐危害大
2019-07-07
-
甘肃省首批医学重点学科出炉10项中医学科
2019-07-07
-
秋木瓜的功效与作用
2019-07-07
-
常活动腿脚经络畅通助长寿
2019-07-07