首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过
[问答题]
有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M,要求返回频数最高的100个词
添加笔记
求解答(0)
邀请回答
收藏(20)
分享
纠错
2个回答
添加回答
1
铁离子
如果一个词的出现次数超过了1MB大小,比如某个词出现了2^17次,总次数乘以单词大小2^4为2MB,那这个词再怎么hash取余也会放到同一个文件里分不开,这种情况怎么办
发表于 2022-03-08 17:56:13
回复(0)
1
pein531
先用hash进行分文件,每个文件不超过1M,对每个文件进行wordcount,最后再对结果文件进行汇总,得到词频最高的top100
发表于 2021-01-14 10:06:14
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
阅文集团
2021
大数据开发工程师
来自:
2023届阅文大数据方...
上传者:
小小
难度:
2条回答
20收藏
1743浏览
热门推荐
相关试题
字符串全排列
Java工程师
C++工程师
iOS工程师
安卓工程师
运维工程师
前端工程师
算法工程师
PHP工程师
测试工程师
安全工程师
c#工程师
数据库工程师
大数据开发工程师
瓜子二手车
2019
评论
(29)
五月份的商品销售额为60万元,该月...
数据分析师
途虎
2021
评论
(2)
来自
途虎养车2023秋招数据...
下列哪两个变量之间的相关程度高
数据分析师
途虎
2021
评论
(4)
来自
途虎养车2023秋招数据...
请列出你所知道的hadoop调度器...
爱奇艺
大数据开发工程师
2018
阅文集团
2021
评论
(5)
来自
2023届阅文大数据方向笔试卷
我们知道Kimball的维度建模里...
大数据开发工程师
阅文集团
2021
评论
(0)
来自
2023届阅文大数据方向笔试卷
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题