2019-12-05 08:54 已编辑

关注

目标检测论文解读2——Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

背景

　　用ConvNet方法解决图像分类、检测问题成为热潮，但这些方法都需要先把图片resize到固定的w*h，再丢进网络里，图片经过resize可能会丢失一些信息。论文作者发明了SPP pooling(空间金字塔池化)层，让网络可以接受任意size的输入。并且用在目标检测任务上，可以只计算一次整图的feature map，再找到region proposal的feature map在原图上的映射，最后进行SPP pooling。

方法

　　(1)首先思考一个问题，为什么ConvNet需要一个固定size的图片作为输入，我们知道，Conv层只需要channel固定(彩色图片3，灰度图1），但可以接受任意w*h的输入，当然输出的w*h也会跟着变化；然而，后面的FC层却需要固定长度的vector作为输入，图片size变化->conv层输出的size变化->FC层输入的vector长度变化，这就产生了错误。

　　怎么解决这个问题呢？作者给出的方法是在最后一层Conv层后面加上一个SPP pooling层，SPP pooling层可以将接收到的不同size的输入转换成为固定的输出，保证FC层的输入长度固定。

　　

　　如图，SPP pooling层的原理很简单，例子如下：给定一个w*h的特征图，把其分别分成4*4、2*2、1*1的bin，在每个bin上面作pooling操作(文中使用的是max pooling)，最后能得到16*256-d(256-d是最后一个conv层的输出通道数)，4*256-d、1*256-d的feature vector，最后连接在一起，得到的就是21*256-d的feature vector。

　　可以看到，不管一开始的w和h取值多少，最后都能得到固定长度的feature vector作为FC层的输入，这样，ConvNet就能接受不同size的图片作为输入了。

　　(2)此外，SPP NET还在RCNN上面作出了共享计算的改进。

　　RCNN的流程是：先求出一张图片的几千张子图，再送到网络中训练。这样会对很多子图重合的部分进行了冗余计算。

　　SPP NET的流程如下：先直接让一张图片通过CNN层，得到feature map，再找到几千张子图在原图的映射，直接得到对应的feature map，再利用SPP pooling层将其转换为固定长度的vector，再用FC层分类，最后进行边框回归修正位置。

总结

　　论文作者通过在FC层前面加上一个SPP pooling层，有效解决了ConvNet必须接受固定size的图片。并且只计算一次整张图的feature map，避免了大量的冗余计算。

缺点

　　SPP NET的缺点在于它的训练过程中，前面的CNN层的参数是不会变化的，用的还是R-CNN的参数。

全部评论

推荐最新楼层

05-08 16:24

太原理工大学 C++

试用期内收到更好offer，该如何提离职？

在试用期收到更心仪的offer是一件很正常的事情，因为各个公司推进时间并不一样，所以这种情况提离职很正常，不用心理负担很重，可以参考以下步骤推进：提前准备好离职说明，确认新offer的所有细节，确保自己已正式决定跳槽，并制定好离职时间。准备好简短、礼貌的离职原因，可以提到新机会更符合个人职业发展。选择合适的沟通方式，尽量面谈提出离职。如果是远程工作，可以通过视频会议等方式更正式地沟通，而不是直接发邮件或消息。表明感谢与尊重，在说明离职原因时，表达对当前公司的感谢，感谢他们给了试用的机会，并在试用期中学到了很多，这样可以展示出你的职业素养与尊重。保证交接与过渡，如果有在负责的工作，主动提出愿意做...

投递口碑等公司10个岗位 >

点赞评论收藏

分享

05-06 18:41

齐鲁工业大学 Java

几周速通大模型实习，你需要做什么？

我通过牛客赚了一包薯片，整整5块，然后一直没到账，然后发现人家放假了，今天到了之后买了吃掉，已经变成葡萄糖了。那么我也是顺利收下几家offer了，没学多久，今天给一下具体路线，求别私信我（真想问问题，直接把问题写上去留个微信，动不动弹出来红点点，你总会去点他的。。），然后东西都是你感兴趣才能去做，你肯定难以接受一天爽学10几个小时。同时五一假期还不出门，连续5天高强度琢磨新玩意，所谓欲戴王冠，必承其重你知道的，光是走马观花肯定很困难。我给出你具体思路还是比较重要的。首先确定走这一行，我的话有两年开发经验，有实习经验，然后直接转行，本身就有基础，计算机的知识是有迁移性质的。我先讲讲大模型ai应用...

面试中的破防瞬间牛友故事会

点赞评论收藏

分享

04-06 11:24

已编辑

太原学院 C++

我嘞个豆啊我还以为是鼠鼠被某司hr一眼看中了😅

不戳的柠檬：培训？

点赞评论收藏

分享

04-22 10:11

西北农林科技大学风电运维工程师

求助🆘大二第一次投实习

请问这算是没戏了么？

被加薪的哈里很优秀：应该继续招人，不会给你留岗位的

点赞评论收藏

分享

05-06 11:50

北京邮电大学移动通讯工程师

大厂加班强度表

好像有点准

我推的MK：感觉这个表格呢好像有用又好像没用，真有offer了不管加班多么严重也得受着，没offer管他加班什么样也只能看看，反正轮不到我选

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试问题记录 #

19281次浏览 327人参与

# 硬件人你反向读研了吗 #

39790次浏览 608人参与

27254次浏览 151人参与

# 硬件人秋招的第一个offer #

65576次浏览 1081人参与

# 滴滴工作体验 #

23252次浏览 123人参与

# 非技术岗投递进展 #

137539次浏览 1222人参与

# 材料进Fab厂真的劝退吗？ #

36060次浏览 158人参与

# 不考虑转正，实习多久合适 #

24075次浏览 118人参与

# 机械求职避坑tips #

41037次浏览 355人参与

# 互联网回暖，腾讯要招5000+人！ #

263521次浏览 4889人参与

# 面试经验谈 #

12473次浏览 190人参与

# 机械只有转码才有出路吗？ #

125876次浏览 1590人参与

# 职场新人生存指南 #

332172次浏览 7133人参与

# 面试吐槽bot #

2499次浏览 31人参与

# 异地恋该为对方跳槽吗 #

23326次浏览 119人参与

# 硬件人更看重稳定还是高薪 #

38500次浏览 203人参与

# vivo求职进展汇总 #

208602次浏览 1341人参与

# 25届如何提前做秋招准备？ #

163913次浏览 2451人参与

# 你遇到过哪些神仙同事 #

69349次浏览 623人参与

# 租房找室友 #

27505次浏览 144人参与

# 深信服求职进展汇总 #

188729次浏览 1694人参与

牛客网
牛客企业服务