面试题简述手上有20亿个手机号,现在需要支持高频查询:给定一个手机号,快速判断它是否在集合中。请设计方案。考虑内存、查询速度、误判率、可扩展性,给出具体数据结构、内存估算、以及如何做到分布式处理。面试官想听的1、是否掌握大规模集合存在性检测常用方法。2、是否能做内存、精读、延迟之间的权衡。3、是否能给出可落地的方案。面试示例回答给20亿个手机号,我们先明确目标:是否允许少量误判?是否允许误报但不能漏报?查询QPS环境如何?常用可选方案有三种主流路径:布隆过滤器 + 后备精确存储、磁盘索引、可压缩位图/哈希分桶。下面我说明下我设计的方案:1、首先方案:Blloom Filter + 精确回查2、...