2019-10-10 21:09 已编辑欢聚时代_Java开发工程师

关注

海量数据去重(set,字典,bloom)

海量数据去重

HashSet

HashSet不重复
可以用O(1)判断数据是否存在
海量数据的话可以拆分到HashMap每个桶或者多台机器上

BitSet

如果海量数据是整数
范围不大
构造bit数组，数据都映射到上面
如两个比特数组可以存0~3->00 01 10 11

字典树

如果海量数据是字符串数据
可以用很小空间开销构建字典树
原理就是每个结点存放一个字符，子树则是下一个字符，当前value为1的话表示root到该节点的字符串存在了

布隆过滤器

原理就是经过多个hash函数散列到bitset中，设为1
查找的时候也是通过多个hash函数看散列到的位置是否都为1，都为1的话则判定存在
由于是hash，容易出现误判
如果hash函数个数设置过大，容易带来更高的时间和空间开销

全部评论

推荐最新楼层

04-29 17:15

已编辑

美团_核心本地商业_后端(实习员工)

还搁简历上写轮子项目呢？2025是AI年，我来告诉你什么值得写！

一句话总结：可以但没必要。为什么不推荐：在现在大面积的同学使用轮子项目的背景下，其实简历中轮子项目早就不能给面试官带来新鲜感了。除非你可以提供相比较于公开方案更加优质/效果相同的解决方案，不然你搞这个轮子项目的意义是什么？因为你毕竟面试的是后端岗位，不是基础架构。但需要注意的是：我们这里仅仅聊的是简历上要不要写，但是通过写轮子项目来更深刻的理解某一个基础组件的架构的话，还是对个人成长很有帮助的。你可以不把轮子项目写到简历上，但可以在面试的时候当面试官提及到相关基础组件，主动去提及自己手搓过一个小型的仿写版，以此来尝试和面试官就该组件展开深入交流。利益和风险共存。当你敢在大厂面试官面前提及手搓基...

投递美团等公司10个岗位 > 代码之外的生存之道实习进度记录

点赞评论收藏

分享

04-26 18:35

快手_后端运维(准入职员工)

快手内推-快手内推码

🙋🏻‍♀️面试： 一共四面，其实只用三面，中间自己争取从偏前线的岗位往中台策略转，所以额外再增加了一面；可能本地生活这块业务确认，挺紧凑的，听HR说很长没看到面试结果全A的候选人了。 🙋🏻‍♀️入职： 接offer👉🏻背调👉🏻结果确认👉🏻到岗前填信息👉🏻入职当天参与培训领电脑👉🏻到用人部门**。嗯😐非常长，长到不想再来一遍那种🥹那种接了offer好像又没接的感觉，家人们谁懂！ 🙋🏻‍♀️工作体验： 啊就是非常的卷…晚上十点可能才有机会下班，入职前第一周了解到，我们部门实习生两三个月来都是十一二点下班🥹怎么说呢工作日是不配拥有生活的，那种洗头都觉得懒，玩手机...

快手公司福利 352人发布

点赞评论收藏

分享

03-08 21:25

沙洲职业工学院运营

遇到霸王合同老实了

learYuan：🐕看了都摇头

点赞评论收藏

分享

03-10 10:28

厦门大学算法工程师

这样的简历还有救吗

导师人年轻，也接不到什么项目，简历看着都没有什么相应的技术栈，想试试华子，不知道有没有机会，通信算法岗或者测试都行，只要有实习岗位就好，有没有大佬帮忙指点一下，这两天在看力扣和八股，但感觉进度很慢很慢#简历##实习##互联网大厂实习   #

我想上班求你了：这已经很好了吧，有竞赛有项目有论文

学历还不错

投递华为等公司8个岗位

点赞评论收藏

分享

04-25 17:57

轮途科技_研发部总经理

面试官问：你如何看待加班？

面试官问：你如何看待加班？这类问题是比较常见的，出现频率相当高。有些同学看到这样的问题，就会断定这家公司估计是经常加班的，绝对的不能去！！！其实也未必，不管你去哪个公司工作，都有可能遇到一些突然的，或者是要紧的时刻，不能就此否定这家公司长期存在加班文化。面试官这么问，主要目的是了解你对于工作时间和工作量的态度，以及你是否能够适应在必要时，能否超出正常工作时间的要求。这也能反映出你对工作的投入程度和责任心。回答这类问题时，你既要表现出愿意在必要时付出额外努力的态度，也要体现出你对工作与生活平衡的重视。以下是一个参考模板：1、我认为，偶尔的加班是在某些特定情况下，确保项目顺利进行或满足紧急需求的一...

人类研究社

点赞评论收藏

分享

评论

1

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 设计人如何选offer #

97929次浏览 680人参与

# 找工作，行业重要还是岗位重要？ #

6910次浏览 85人参与

# 五一之后，实习真的很难找吗？ #

44484次浏览 312人参与

# 领导秒批的请假话术 #

9662次浏览 73人参与

# 盲审过后你想做什么？ #

12330次浏览 110人参与

# 外包能不能当跳板？ #

22038次浏览 191人参与

# 考研可以缓解求职焦虑吗 #

20552次浏览 244人参与

# 五一假期，你打算“躺”还是“卷”？ #

26158次浏览 399人参与

# 面试等了一周没回复，还有戏吗 #

115240次浏览 1072人参与

# 找工作前vs找工作后的心路变化 #

7118次浏览 64人参与

# 牛友们的论文几号送审 #

27152次浏览 623人参与

# 应届生薪资多少才合理？ #

3050次浏览 24人参与

# 你喜欢工作还是上学 #

37365次浏览 409人参与

# 如何缓解入职前的焦虑 #

171707次浏览 1267人参与

# 每人推荐一个小而美的高薪公司 #

72819次浏览 1357人参与

# 如果有时光机，你最想去到哪个年纪？ #

43201次浏览 765人参与

# 硬件人，你被哪些公司给挂了 #

46486次浏览 719人参与

# 写简历别走弯路 #

714118次浏览 7849人参与

# 大疆的机械笔试比去年难吗 #

69568次浏览 602人参与

# 扒一扒那些奇葩实习经历 #

41595次浏览 770人参与

牛客网
牛客企业服务