百度数据研发暑假实习现场一面

1.讲一下Shuffle过程,reduce如何知道去拉取哪些map的数据
2.map的数量是怎么确定的
3.为什么切片的大小要尽量和物理块大小保持一致,我说了句寻址时间,直接问我磁盘如何寻址的,泪目,直接说不会
4.做道题,给一个文本文件,里面有一万行,每一行有单词,单词有重复的,统计重复次数的前三名,用shell写,写不出来,让我Java,我用了哈希表和大顶堆,说我空间复杂度太大,有没有优化的方式,我说不会
5.数仓是干嘛的,和普通业务数据库有什么不一样
6.olap和oltp知道么,有什么区别
7.说一下数据仓库的五层都是干嘛的,有没有解析的过程
8.窗口函数知道么,讲一讲你知道的窗口函数,有没有自己写过udf
9.mysql都有哪些引擎,他们的区别是啥,mysql的锁知道么,回答说不知道,然后又问我Java多线程里面都有哪些锁,我就讲了sychronized,volatile,cas锁
#实习##百度##数据开发工程师##面经#
全部评论
说一下,切片大小和物理块保持一样的原因:如果分片跨了两个数据块 那肯定有一个块是放到另外一台机器上的,存储在两个节点上需要网络io加载数据,不能做到本地化。
1 回复 分享
发布于 2021-04-16 15:43
百度数据开发在北京还是上海
点赞 回复 分享
发布于 2021-04-17 09:56
第四道使用归并排序
点赞 回复 分享
发布于 2021-04-16 20:03

相关推荐

10-19 10:28
已编辑
成都理工大学 后端工程师
团孝子已上线feeling:面了很多家公司,能感受到目前只有小公司+外包喜欢问八股。大厂虽然也问八股,但是是从实习、项目中进行提问,并且大厂会问很深,面试官也会对你的回答进行思考➕追问,所以准备大厂面试前一定要备好相关资料。对于算法,我做的是codetop前100+力扣hot100+力扣高频150,面试中实感hot100就足够,基本上只要是hot100就秒答。对于项目和八股,我做的也是烂大街的星球项目,八股则是看小林和问ai,自己也写了很多技术博客和画了很多思维导图,并且自己也尝试用嘴巴说出来,不只停留于纸面。运气也很重要,必须要让面试官/HR看到简历才行,所以建议投递时间是下午两点。tl:第一岗位9.9 投递9.10 一面(一面评价:最近见过最强的大三,结束五分钟后约二面,都晚上九点了不下班吗)9.11 二面(三道算法a出两道,反问评价:经验不够等横向,我实习生要啥经验)9.21挂(实习时间过短+其他原因,想要一年实习的,为什么不招个正职)第二岗位10.10投递10.11约面(主管打电话,说看到我之前投递记录了想要我挂qa职进去干后端,同意)10.14 一面(无八股,主动说确实很强,意愿很强)10.16 oc其余,友邦,东软,东华,惠择,用友oc已拒京东测开一面挂(投后端被测开捞)腾讯测试已拒(投后端被测开捞)ps:表扬惠择的主管面,没怎么问技术(可能是一面面试官沟通过了),全程一起讲大道理,解答了心中很多疑惑,也告诉我以面试官角度来看怎么选候选人,如果可以下次一定选惠择
HeaoDng:美团好像可以触发一面通
点赞 评论 收藏
分享
09-17 19:25
已编辑
太原理工大学 游戏测试
叁六玖:公司名发我,我要这个HR带我打瓦
我的秋招日记
点赞 评论 收藏
分享
评论
3
16
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务