【手撕算法】LC显著性检测算法

前言

显著性检测,顾名思义,就是提取一幅图像中的突出对象,灵感就来自于人的视觉特性,如果一张底色纯白,中间一块黑色的纸,那人眼的注意力肯定就会在黑色部分,而显著性检测就是计算图像的显著性图,突出部分显著性图的值就高。

显著性检测工作往往伴随这其他工作,比如分割,分割可以基于显著性检测的结果来进行分割,进而把突出对象分割出来。

本来是想做缺陷检测来着,但一不小心看了两天的显著性检测论文,所以出四篇文章分享四个显著性检测算法:LC/HC/AC/FT

这四个算法都特别特别简单,而且得益于网络的发达以及前辈的总结,学起来简直不能再容易了。

此外我建了一个微信视觉算法交流群,加我微信yanshilin216备注“加群”拉大家进群交流。

算法原理

论文名:

Visual Attention Detection in Video Sequences Using Spatiotemporal Cues

该算法可以用一句话概括:每个像素的显著性值是该像素距图片所有其他像素的某个距离的和。这个距离一般是像素特征值的欧式距离。

所以公式也就很明了了:

S§就是显著性值,d(p,q)就是像素p距离q的距离,I就是整幅图像。
这个显著性检测数学模型就是这么简单。

不过代码却不能直接for循环写,时间复杂度会很高的,所以可以利用直方图进行优化。

  1. 将像素的特征值归一化到[0,255],如果图像是单通道,这个特征值就是像素灰度值。我们计算的距离也就是特征值之间的颜色距离。然后利用直方图对图像特征值进行统计,得到fn,即特征值在图像中出现的次数。

    这时显著性计算公式为:

    其中d(p,n)为特征值p和n的欧氏距离。

  2. 为进一步优化,我们提前计算出每一个d(n1,n2)。由于任何两个像素的特征值都在[0,255]之间,可以提前计算距离矩阵D。这样就可查表得到两个像素的特征距离。这样特征值p的显著性进一步优化为:

  3. 记录已经计算的显著值,避免重复计算。

该算法缺点:

其求全局对比度的策略会导致稀有颜色(特征值)占优,也就是具有较高的对比度,这在很多情况下是不合理的。所以的方法检测效果不够好

算法实现

算法流程:

  1. 计算图像特征值的直方图
  2. 遍历图像计算特征值距离矩阵D
  3. 为每一个对应像素值分配显著值,得到显著图
  4. 将显著图归一化到[0,255]范围内并显示

具体代码:

void LC::calculateSaliencyMap(Mat *src, Mat * dst)
{   
  Mat img;
  //【1】处理灰度图
  if ((*src).channels() == 3)
    cvtColor(*src, img, COLOR_BGR2GRAY);
  else
    img = *src;
  //【2】定义变量并初始化为0
  double f[256], s[256];
  memset(f, 0, 256 * sizeof(double));
  /* memset(void *s,int ch,size_t n)
  memset函数是计算机中C/C++语言函数。将s所指向的某一块内存中的前n个字节的内容全部设置为ch指定的ASCII值, 
  第一个值为指定的内存地址,块的大小由第三个参数指定,这个函数通常为新申请的内存做初始化工作, 
  其返回值为指向s的指针。所在头文件<memory.h>或<string.h>*/
  memset(s, 0, 256 * sizeof(double));
  //【3】统计直方图
  for (int r = 0; r < img.rows; r++)
  {
    uchar* data = img.ptr<uchar>(r);
    for (int c = 0; c < img.cols; c++)
      f[data[c]] += 1;//直方图f   将对应像素值的直方图加1
  }
  //【4】计算特征显著值并保存到S[]
  double s_min = DBL_MAX, s_max = 0;
  for (int i = 0; i < 256; i++)
  {
    for (int j = 0; j < 256; j++)
      s[i] += abs(i - j) * abs(i - j) * f[j];//直方图的累积
    if (s[i]>s_max) s_max = s[i];
    if (s[i]<s_min) s_min = s[i];
  }
  //【5】显著特征值归一化到0-255
  for (int i = 0; i < 256; i++)
  {
    s[i] = (s[i] - s_min) / (s_max - s_min)*255;
  }
  //【6】为每一个像素分配显著值。(i,j)是什么灰度级就赋予它相应灰度级的显著值。得到显著图。
  Mat salimg(img.size(), CV_64F);
  for (int r = 0; r < img.rows; r++)
  {
    uchar* data = img.ptr<uchar>(r);
    double* sal = salimg.ptr<double>(r);
    for (int c = 0; c < img.cols; c++)
      sal[c] = s[data[c]];
  }
  salimg.convertTo(*dst, CV_8U, 1, 0);
}

算法效果

输入为灰度图,输出为显著图:


THE END

今天就到这里啦。接下来的三天会把剩下的HC/AC/FT三个算法更新完。需要代码的欢迎加微信群。

全部评论

相关推荐

已经入职字节快一个月了,突然想起来之前那段时间的面经没有发,先发一下timeline吧。Tiktok&nbsp;内容安全平台(人才库电话捞我):电话10.28&nbsp;-&gt;&nbsp;一面10.30(我觉得你跟我们组业务挺match的,然后过了三天问hr挂了,应该是别人流程更快)阿里淘天:投递11.11-&gt;约面11.12-&gt;一面11.14(问得很简单,30分钟,手撕八股全过无后续)Kpi面腾讯wxg&nbsp;微信小程序:投递11.13&nbsp;-&gt;约面11.14-&gt;&nbsp;一面11.17&nbsp;(究极无敌拷打,问我多模态大模型涉及的算法?但是人很好)-&gt;11.19流程终止小红书&nbsp;风控平台:投递11.16&nbsp;—约面11.17&nbsp;&nbsp;-&gt;一面11.18&nbsp;(抽象的面试官,面试感觉一般,问得前端网页安全相关的,确实没准备)-&gt;11.20挂百度&nbsp;百家号:投递11.14&nbsp;—&gt;约面11.14&nbsp;-&gt;一面11.14(当场约2面)-&gt;二面11.24-&gt;口头告知offer,&nbsp;拒绝(原因是业务不太好)美团&nbsp;技术平台投递11.17&nbsp;-&gt;&nbsp;约面(忘记了,没多久)&nbsp;-&gt;一面11.19&nbsp;-&gt;二面11.21&nbsp;(字节offer不想面了)快手&nbsp;电商业务投递11.17&nbsp;-&gt;&nbsp;约面11.18&nbsp;-&gt;一面11.19&nbsp;-&gt;&nbsp;二面11.21(拒了)腾讯wxg&nbsp;微信支付(被捞):(直接发面试邮件)技术一面12.05&nbsp;-&gt;技术二面12.11&nbsp;-&gt;技术三面12.17&nbsp;-&gt;&nbsp;hr面已拒绝(了解业务后拒绝,但是有转正hc,感觉还蛮可惜)字节跳动&nbsp;xxxx:东家就不放具体的时间线了,大概是面完第二天就能知道结果,除了有几天ld请假了没填面评。不去wxg还有个原因是还在期末周,深圳学校来回太麻烦了,至少现在在的组感觉能学到很多的东西,自己的选择应该也没错。还是感概一下,一年前大二的时候投简历海投基本上石沉大海,无论大小厂约面比例很少。现在基本上投了就有面试,还都是以前梦寐以求的大厂,现在自己也有了更多的选择,也没有投太多简历。也感谢上一段实习的经历,很有意思的项目,无论是字节,腾讯,还是美团基本都有聊这个项目。面经需要等一下,也许等周末有空了再发给各位uu,感兴趣可以关注一下~有想要交流学习的同学也可以私信我,目前人在北京大钟寺~,可以找搭子~
正能量的牛可乐:这么多大厂面试下来,不仅摸清了不同公司的面试风格,还能精准避雷业务不匹配的岗位,血赚
实习简历求拷打
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务