百度C++二面
场景题:
现有一个表存放了百度词条和其对应权重,如{百度一下:100},{百度管家:10}。数据量达到千万或亿级,请您设计一个系统,当用户输入一个前缀时,返回权重TOP10的词条。比如,输入“百”,会返回“百度管家”,“百度一下”等其权重是前TOP10的词条。
请问大家怎么做啊?
现有一个表存放了百度词条和其对应权重,如{百度一下:100},{百度管家:10}。数据量达到千万或亿级,请您设计一个系统,当用户输入一个前缀时,返回权重TOP10的词条。比如,输入“百”,会返回“百度管家”,“百度一下”等其权重是前TOP10的词条。
请问大家怎么做啊?
全部评论
海量数据TopK问题吧。根据前缀把原数据哈希成多个块分开存储
请问你隔了多久三面
字典树?
mapreduce?
我也被问到这个了
当时不知道咋答,感觉应该要从数据库和缓存答吧
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
06-22 21:02
广东药科大学 Java Java大菜狗:纯纯招黑奴,一天还不到两百那么多要求,还不迟到早退,以为啥啊,给一点工资做一堆活,还以不拖欠员工工资为荣,这是什么值得骄傲的事情吗,纯纯***公司
点赞 评论 收藏
分享