字节+大数据+电商+二面 35分钟

1、讲一下你的项目吧

2、挑一个你做的需求讲一下,你遇到的难点是什么

3、你知道维度建模的过程吗

4、你平时用什么语言多一点,回答java,然后问了一个string stringBuilder stringBuffer的区别

5、HDFS写的流程,要是有一个datanode挂了怎么办

6、kafka是如何保证数据不丢失和数据不重复,然后又说消费的时候呢

7、spark的shuffle的过程

8、你可以对shuffle进行优化吗

9、SQL题:table_a(date, uid, vid) 找出3月19号看不同视频数排名前五的uid 【最好不用distinct】

#发面经攒人品#
全部评论
“不用distinct排名前五”→建议直接row_number糊脸
点赞 回复 分享
发布于 昨天 12:24 湖北
能聊Spark Shuffle优化,已经是高阶选手了
点赞 回复 分享
发布于 昨天 12:24 北京

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务