Shopee后端研发 开放式问答

问,十亿的数据量,每条数据4个字节,如何去重,或者统计每条数据出现的次数;
面试官开始没有说数据量,我回答是,在不考虑空间复杂度的情况下,用集合或哈希表;
面试官后来加入了数据量,和内存不够的条件,我没啥思路,乱答的前缀树做压缩;
这个有什么方法吗?
#shopee校招##Shopee##面试题目#
全部评论
如果只考虑去重、不考虑统计次数的话,可以用布隆过滤器。假设数据量 10^9,失误率 0.1,计算器敲除所需位数换算成内存大小是 571MB,感觉还是有点大。。。没有实操经验,不太懂
1 回复 分享
发布于 2021-07-15 19:49
布隆过滤器只能判断一个元素是否一定不存在,怎么统计个数?不懂你们这些说布隆过滤器的?
点赞 回复 分享
发布于 2021-07-18 01:11
位图最简单
点赞 回复 分享
发布于 2021-07-15 20:04
bitmap
点赞 回复 分享
发布于 2021-07-14 19:41
最小计数
点赞 回复 分享
发布于 2021-07-12 17:46
布隆过滤器了解一下
点赞 回复 分享
发布于 2021-07-12 17:27
hyperloglog
点赞 回复 分享
发布于 2021-07-12 14:51
位图
点赞 回复 分享
发布于 2021-07-12 14:16

相关推荐

点赞 评论 收藏
分享
好在哪里了?我请问了?
_hengheng:很好啊,我看旁边同事都入职了都有工作
点赞 评论 收藏
分享
代码飞升:别用口语,后端就写后端,前端就写前端,最后别光后悔
点赞 评论 收藏
分享
董春花_:真诚无罪,别听评论区那个清华的。按他的逻辑,你有分寸人觉得你是不想来,你积极热情人觉得你太想来,你好骗人就可你养鱼,你不好骗人觉得你服从性不高,合着**做啥都白扯。保持谦逊礼貌与对offer的积极性不才是最正常,也正确的做法么?招聘方的错强加到应聘者身上,***何不食肉糜。
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
06-19 20:55
因为业务不是喜欢的,所以就没去,现在实习工作也有很多dirtywork,很后悔,怎么能舔回这个offer啊
flmz_Kk:试一试跟hr舔回来,不过保不齐米的活也有很多dirtywork,只能说不要美化自己没走过的路
点赞 评论 收藏
分享
评论
点赞
29
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务