Shopee后端研发 开放式问答

问,十亿的数据量,每条数据4个字节,如何去重,或者统计每条数据出现的次数;
面试官开始没有说数据量,我回答是,在不考虑空间复杂度的情况下,用集合或哈希表;
面试官后来加入了数据量,和内存不够的条件,我没啥思路,乱答的前缀树做压缩;
这个有什么方法吗?
#shopee校招##Shopee##面试题目#
全部评论
如果只考虑去重、不考虑统计次数的话,可以用布隆过滤器。假设数据量 10^9,失误率 0.1,计算器敲除所需位数换算成内存大小是 571MB,感觉还是有点大。。。没有实操经验,不太懂
1 回复 分享
发布于 2021-07-15 19:49
布隆过滤器只能判断一个元素是否一定不存在,怎么统计个数?不懂你们这些说布隆过滤器的?
点赞 回复 分享
发布于 2021-07-18 01:11
位图最简单
点赞 回复 分享
发布于 2021-07-15 20:04
bitmap
点赞 回复 分享
发布于 2021-07-14 19:41
最小计数
点赞 回复 分享
发布于 2021-07-12 17:46
布隆过滤器了解一下
点赞 回复 分享
发布于 2021-07-12 17:27
hyperloglog
点赞 回复 分享
发布于 2021-07-12 14:51
位图
点赞 回复 分享
发布于 2021-07-12 14:16

相关推荐

08-07 11:15
门头沟学院 Java
感觉他们公司效率好高,秒挂我简历然后又给我推荐了岗位让我投原批yyds
没有offer别哭好...:是的,然后我投了邮件里的链接,又秒挂了
投递米哈游等公司10个岗位
点赞 评论 收藏
分享
08-05 18:14
门头沟学院 Java
小花的沉默:是学历厂没错啊,学历太高了不要
投递小鹏汽车等公司10个岗位
点赞 评论 收藏
分享
白火同学:先说结论,准大三不是特别好找实习,boss沟通300+没有实习是很正常的情况。一是暑期实习时间太短了,二是在这么多准大四都找不到实习,从实习时间和掌握技术层面,企业会优先看他们。 再说简历,其实985本+准大三到这水平的简历也很优秀了,要说的话,项目经历可以再优化一下,可以基本围绕采取STAR原则,分为项目概述、技术架构、技术亮点、实现结果,再发给AI润色一下。 最后说操作,准大三的话,如果想找实习那就多投,不过现在也7月中旬了,时间上已经略晚了。如果7月底实在找不到,也可以多刷点算法,多学点技术,这实习也不至于一定得有,当然有更好。
点赞 评论 收藏
分享
评论
点赞
29
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务