2019-08-19 17:18 Java

关注

Object Detection之Fast R-CNN

简介

Fast R-CNN在R-CNN的基础上改善了训练和测试速度，同时提高了检测准确率。Fast R-CNN使用了VGG16，训练时比R-CNN快了9倍，测试时快了213倍。
R-CNN模型的复杂度主要来自两个方面：很多proposal需要处理，同时这些proposal的定位比较粗糙，必须改进才能得到准确的定位结果。
R-CNN有一些显著的缺点：

训练需要多个阶段：需要训练CNN和SVM。
训练需要的空间、时间很多。
目标检测很慢，用VGG16检测速度为47s/image。
其中，因为R-CNN需要对每个proposal跑CNN，所以很慢。
Fast R-CNN有如下优点：高mAP、单阶段训练、训练更新所有权重、不用存储feature。

模型结构

模型结构
Fast R-CNN的输入是图片和一系列proposal。通过卷积和max池化产生feature map(特征图)。接着，对每个proposal，使用region of interest(RoI) pooling 从feature map中提取定长的feature vector。每个feature vector被喂进fully connected(fc)层，然后产生两个分支：第一个使用softmax产生(K+1)个分数，K为类别数，1为背景；另外一个分支产生4个实数代表bounding box的位置。

RoI Pooling

RoI pooling层使用max pooling把RoI转化成较小的大小固定的feature map（例如7×7）。论文中用(r,c,h,w)表示每个RoI，(r,c)为左上角的顶点，(h,w)为图片的高和宽。
RoI max pooling把大小为h×w的RoI划分成H×W个小格，每个大小约为h/H × w/W，然后在每个小格进行max pooling。pooling对每个channel是独立的。

从pre-trained网络进行初始化

首先，把最后的max pooling层换成RoI pooling层，接着，把网络最后的fc层和softmax层换成两个分支：K+1分类和bounding box回归。最后，网络的输入修改为图片和RoI。

对detection进行fine-tuning

Fast R-CNN训练使用的SGD mini-batch是通过分层采样得到的。首先，选取N张图片，之后从每张图片取R/N个RoI(N=2,R=128)。因为，同一种图片共享前向和后向的过程，节省了计算复杂度。

Multi-task loss

Fast R-CNN有两个输出，对于每个RoI，第一个输出K+1个类的离散概率分布，通常又fc后用softmax得到，第二个输出对每个类产生bounding box回归的偏移量。用多任务loss L来训练分类和bounding box回归：
$图片说明$
其中， $图片说明$ 。只有u大于等于1的时候，即ground truth存在目标时才有第二项loss。u=0时即为背景。
对于bounding-box 回归，使用Smooth L1 loss：
$图片说明$
其中，
$图片说明$
这个loss对于outlier不会太敏感。
Multi-task loss中的lambda平衡两个任务的loss，对v进行归一化操作，使用lambda=1。

Mini-batch sampling

使用R=128，每张图片采样64个RoI。其中，与ground truth bounding box的IoU至少为0.5的取25%，其余的RoI从IoU为[0.1,0.5)的区间选取。训练时，图片以0.5的概率随机水平翻转。

RoI pooling层的Back-propagation

假设 $图片说明$ 输入进RoI pooling层，第r个RoI的第j个输出为 $图片说明$ ，其中 $图片说明$ ， $图片说明$ 是 $图片说明$ max pool输出的下标。
RoI pooling层的反向可以计算：
$图片说明$

Truncated SVM 加速检测

使用SVD，一层的参数可以表示为
$图片说明$
Truncated SVD把参数数目从uv减少到t(u+v)。

结果

图片说明

论文

全部评论

推荐最新楼层

05-10 20:41

已编辑

众安保险_技术研发部_Java开发高级工程师

暑期实习不转正？？还有什么意义！！！

我开始真的不太懂，暑期实习除了是个实习还和普通的实习有什么区别，然后后来知道，是可以转正，那既然这样的话，不转正的暑期实习还有什么意义？！简单说一下我的情况，本人23届985计算机理工科毕业，我在22年春招开始找实习，后面顺利进入众安保险开始暑期实习。我是22年春招面试通过的，7月份来实习，在众安保险上海总部做后端开发，虽然学校远在东北，但也在众安待了6个月(其实在实习3个月时候就已经通过了转正答辩，这时学校没课啦，就继续实习)。这里特别强调：公司的HR讲过，每年众安的校招生有70%左右都是来自实习生留用，我毕业那年甚至90%都是实习转正，也给足了我实习期努力的动力。自认为通过在众安的实习，我...

不给转正的实习，你还去吗没有实习经历，还有机会进大厂吗

点赞评论收藏

转发

04-07 11:41

四川轻化工大学计算机类

大三找java暑期实习

#简历##简历被挂麻了，求建议#大佬们看看，这玩意儿能找到，实在不行去当兵了

简历被挂麻了，求建议

点赞评论收藏

转发

05-12 23:58

C++

租房被坑第二年

第一年刚毕业，跟着一个中介从早上走到下午4点多，当时脑子昏了没有仔细检查。住进去之后才知道好多问题，水压太低，花洒出水量很少，马桶冲不干净，洗衣机声音特别大，通勤距离也不行，卧室完全照不到阳光，商超菜市场都很远，网还烂的一批。最近又重新找房子，事先都检查过这些问题，确定他们不要中介费后，也看了好几天才决定租的房子。结果前脚刚签完合同，后脚来一句“中介费结一下”。？？？他说之前看的都是他们公司的资源，租了不要中介费，但这间是他其他中介的，我们没有提成所以要钱？然后我问他为什么不事先说明，要等到我签了合同和房东交接完后再说(他还特地问了一句“合同签完了吧”)，他就扯开话题，我一直问为什么不事先说有...

租房前辈的忠告

点赞评论收藏

转发

点赞收藏评论

全站热榜

正在热议

# 牛客帮帮团来啦！有问必答 #

695534次浏览 11381人参与

# 你的秋招进展怎么样了 #

497839次浏览 13393人参与

# 如何缓解入职前的焦虑 #

33135次浏览 339人参与

# 找工作时遇到的神仙HR #

176089次浏览 1735人参与

# 如何写一份好简历 #

257157次浏览 3891人参与

76655次浏览 1537人参与

# 找工作，你会甘心进小厂还是猛冲大厂 #

34413次浏览 350人参与

# 通信硬件人笔面经互助 #

105519次浏览 2142人参与

# 无实习如何秋招上岸 #

221862次浏览 3480人参与

# 互联网公司评价 #

78525次浏览 1079人参与

# 投了多少份简历才上岸 #

56188次浏览 945人参与

# 市场营销面经 #

4276次浏览 121人参与

# 产品人求职现状 #

50294次浏览 742人参与

# 面试中的破防瞬间 #

81834次浏览 1009人参与

# 软件开发投递记录 #

466634次浏览 7126人参与

# 23届的你们都什么时候入职？ #

84327次浏览 736人参与

# 互联网公司爆料 #

36132次浏览 367人参与

# 科大讯飞求职进展汇总 #

36248次浏览 369人参与

# 你觉得今年秋招难吗 #

300533次浏览 5669人参与

# 通信硬件薪资爆料 #

193154次浏览 1716人参与

牛客网
牛客企业服务