百度数据研发暑期1面

1.说下之前实习经历,以及都使用了什么样的技术栈
2.说下MR和spark的区别,为什么spark会更快,说下两者shuffle的区别
3.ReduceByKey和GroupByKey区别
4.Mysql怎么处理大数据量下的性能问题,了解过分库,分表吗
5.说下了解哪些mysql的索引
6.如果枚举值不多的情况下,数据量有几百万的数据,这种情况下用哪种索引合适一些
7.如果是两个枚举值的话呢?比如说性别,了解过bitmap吗
8.说一下物化视图和视图
9.说一下星型模型和雪花模型
10.什么情况用星型模型,什么时候适合用雪花模型
11.事实表记录着什么样的数据
12.累计快照事实表,周期快照事实表
13.说一下缓慢变化维
14.说一下拉链表的整个数据表结构是什么样

两道linux命令 两道sql
全部评论

相关推荐

翱翔龙骑:耗材的幻想
点赞 评论 收藏
分享
06-19 13:40
武汉大学 Java
点赞 评论 收藏
分享
06-12 16:50
已编辑
小米_软件开发(准入职员工)
晓沐咕咕咕:评论区没被女朋友好好对待过的计小将可真多。觉得可惜可以理解,毕竟一线大厂sp。但是骂楼主糊涂的大可不必,说什么会被社会毒打更是丢人。女朋友体制内生活有保障,读研女朋友还供着,都准备订婚了人家两情相悦,二线本地以后两口子日子美滋滋,哪轮到你一个一线城市房子都买不起的996清高计小将在这说人家傻😅
点赞 评论 收藏
分享
风中翠竹:真的真的真的没有kpi。。。面试官是没有任何kpi的,捞是真的想试试看这个行不行,碰碰运气,或者是面试官比较闲现在,没事捞个人看看。kpi算HR那边,但是只有你入职了,kpi才作数,面试是没有的。
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务