ROI Pooling 与 ROI Align 计算示例图解

ROI Pooling 与 ROI Align

假设原图尺寸大小为256×256,预测ROI的坐标为(6.4, 12.8, 153.6, 172.8),特征图大小为8×8。现在要将ROI池化成3×3大小。我们来对比一下Roi pooling 和 ROI Align的区别。

将ROI区域映射到特征图上

对于ROI pooling而言,计算出来的坐标要取整,结果为(1,1,4,5),此处进行了第一次量化;而ROI Align直接将坐标值除以32即可,结果为(0.2, 0.4, 4.8, 5.4)。

圆圈代表像素点,橙色框是ROI映射到特征图上的范围。

划分池化区域

ROI pooling在划分池化区域的时候,由于roi的大小无法被池化尺寸整除,因此出现不同的池化范围(此处进行了第二次量化)。ROI Align在进行池化区域划分的时候,不进行量化处理。

红色线代表池化范围界限

池化值的计算

计算最大池化时,对于ROI Pooling,直接选出池化范围内的最大值即可,上图打蓝色勾勾的像素,池化结果如下图所示:

对于ROI Align则比较复杂。

  • 因为最后要池化成3×3的大小,因此整个roi被划分成9个区域,每个区域称为cell。
  • 首先在每个cell内采样,此处采样系数取2,因此在池化范围内采样2×2=4个点。将cell划分成4部分,每一部分的中心点作为采样点(图中蓝色点)
  • 每一个蓝色点的值通过双线性插值计算。
  • 取四个蓝色点中最大的值作为该cell的池化结果。

双线性插值计算方法

如上图,每一个蓝色点周围都有4个像素点,蓝色点的值极为该4个点的加权平均,权重是距离像素点的距离,距离越近,权重越大。如下图所示。

圆圈代表像素值,色块面积代表权重。以红色点为例,待计算点(黑色点)距离红色点最远,因此它权重最小,反映在色块面积上就是红***块面积最小。说明红色对黑色点的影响比较小。

全部评论

相关推荐

昨天 00:04
已编辑
吉林大学 Java
约面的挺突然。。狠下心接了1.自我介绍2.讲讲JAVA的反射3.可以继续讲讲AOP,动态代理[ 因为讲反射不小心吟唱到了例如AOP的动态代理,但是这块记忆的非常不熟,结果磕磕绊绊 ]4.项目我看你写了AOP和注解,具体怎么实现滑动窗口限流的[ 梦到什么说什么,吟唱八股发散千万不要散到自己不熟悉的区域 ]5.也讲讲为什么另一个项目选择令牌桶,具体流程6. OK,讲讲 Redis 的数据类型?还有吗?就了解这五种嘛[ 把5个的基础类型从应用对比到历届底层全都吟唱了一遍。一句还有吗直接没力气了,简历就写了理解5种,别的我是真一点没看TT ]7.讲讲Redission分布式锁实现8.这个指数退避怎么实现的9.在这里有考虑去保障幂等性嘛10.这里为什么使用指数退避呢? 什么时候用均匀重传[已经晕过去了说不了解,刚说了后就意识到,估计应该说指数退避能缓解压力防止下游服务器雪崩之类的]11.ok,那讲讲JMM12.讲讲RocketMQ如何保证的不丢消息13.讲讲RocketMQ延迟消息原理14.讲讲项目Redis实现会话记忆这一块15.如果ai调用function calling出现幻觉,有考虑怎么解决吗?[ 不了解,面试官说什么接口幂等化,高危操作人工防护,没在听,感觉人已经飞升了TT ]16.mcp了解嘛?和function calling有什么区别[ 依旧不了解,只能说了个前者规范架构抽象解耦,后者耦合高只能算个工具调用]17.AI生成代码的代码质量怎么保障,那平时如何review的呢18.算法。lc215  数组中最大第k个元素19.打算考研还是本科就业20.反问1️⃣有哪里不足,有哪些需要提高的部分。[主要说知识广度不够,多刷算法,让我别太紧张]2️⃣部门业务会做什么人生第二次面试。感觉大厂面试官的气场压力很大应该凉了不过这次面试非常锻炼心态,多面试,多面试。
Luxlord:面经太硬核了
点赞 评论 收藏
分享
评论
2
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务