2017-08-23 19:59 已编辑中国农业大学 Java

关注

如何快速的找出重复的数据

现在数据库中有2亿条数据，很多都是重复的，大概真正去重后也就2000多条左右，该怎么快速找出这2000多条数据？

全部评论

推荐最新楼层

没offer只能回家种地

东南大学 Java

为什么数据库会有那么多重复啊，你应该先问面试官让他说说具体情境吧

点赞回复分享

发布于 2017-08-24 00:33

haolexiao

北京大学 C++

总共也就2000多条不同的数据，直接hash不就好了

点赞回复分享

发布于 2017-08-23 21:42

君不知

浙江大学 C++

如果有这样的情况，不是说明数据库的设计有点问题吗。。。

点赞回复分享

发布于 2017-08-23 21:38

生从何来，死往何去

长安大学 Java

先hash分成很多小文件，然后，分布式进行，hash判断，不知道对不

点赞回复分享

发布于 2017-08-23 21:00

波利要吃饼干

北京邮电大学 C++

布隆过滤器？

点赞回复分享

发布于 2017-08-23 20:24

doramc

香港科技大学前端工程师

mark。。这种海量数据的怎么搞。。

点赞回复分享

发布于 2017-08-23 20:17

一千年以后世界早已没有我

广东财经大学 Java

select distinct一下？

点赞回复分享

发布于 2017-08-23 20:08

Lynn，

华 Java

hash

点赞回复分享

发布于 2017-08-23 20:02

今天 13:56

山东大学光学工程师

实习了三天，好！想！跑！路！

我好纠结啊26届生投递了半年年简历也没收到合适offer现在实习的这个是最近拿到的最好的了，工资待遇相对我的背景来说确实很不错了，还是双休，同事氛围目前看也行，甚至可能很多人会说我不知好歹，毕竟大环境不太好但是！活很多，不仅要做招进来岗位的很多事情，还要接很多其他人的工作，我觉得这本身就是压榨，而且后面会有几个月是一个人独立做工作，像是打杂的，哪里需要去哪里，这让我觉得喘不过气来，显得这个薪资待遇好像也没有性价比很高的样子。而且离家也远，没什么朋友在这里。啊或许是我太矫情了，也或许是它的缺点恰好是我不太能接受的点吧，心里的天平其实已经倾斜了

实习最想跑路的瞬间

点赞评论收藏

06-12 11:16

湖南大学 Web前端

牛友们是都不考虑小厂吗？

我看到好多人都在说0offer好焦虑，结果一看是投了百度快手字节啥的。好像大家都是只想通过校招进大厂，对小公司是不考虑的吗😂可是能进大厂的难道不是只有少部分人吗，真心发问

梦想是成为七海千秋：沉默的大多数吧，喜欢晒的都是能引起共鸣的大厂，找小厂的人，别人也不认识你这个小厂，就自己偷偷找了实际上大多数人哪有什么机会能找到大厂

点赞评论收藏

05-11 20:45

赣南科技学院 Java

难绷，这是。。

不是吧，面试都这样了  

有担当的灰太狼又在摸鱼：零帧起手

查看图片

点赞评论收藏

05-19 19:15

已编辑

浪潮集团_后端开发(实习员工)

麻了

😥😥😥

牛客383479252号：9，2学生暑期实习失利开始投小厂，给这群人整自信了

点赞评论收藏

06-13 18:05

中国传媒大学营销

华为客经能去吗？

客经开奖了，虽然华为是一个好企业(家人都想让我去)，但是我目前挺犹豫的，目前手上还有个字节的产运日常实习offer，牛友们能给个建议吗

投递华为等公司8个岗位 > 华为求职进展汇总

点赞评论收藏

全站热榜

华为开奖进展

热聊中

创作者周榜

正在热议

# 产品实习，你更倾向大公司or小公司 #

151796次浏览 1935人参与

# 你最满意的offer薪资是哪家公司？ #

28826次浏览 159人参与

# 工作经验重要还是工资重要？ #

131925次浏览 1005人参与

# 听到哪句话就代表面试稳了or挂了？ #