一、前言 在编程的世界中我们很有可能会面对处理的数据量在逐渐增大,并且到一个非常大的数据量的问题,我们这时候还需要判断一个数据是否存在“数据池子”中(可以简单的想象为判断要执行去重操作),然后在进行下一步的操作。对此我们通常的解决办法是维护一个数据结构来保存池子中的数据,在池子中找被检测数据是否存在。类似黑白名单功能一样。 但是在数据量非常大时存在着一系列问题,例如存储数据会消耗很多系统资源,检索性能低下等等。这时我们就会想到用布隆过滤器和Bitmap。以数据类型为int举例,如果采用HashSet或者HashMap存储,占4字节,即32bit。而前二者只要1bit存储(理论上16G的内存数据...