字节跳动大数据-Data面经

忘得差不多了,说下我记得的
1面:
ConcurrentHashmap底层是怎样的,怎么保证线程安全
synchronize底层原理
了解哪些GC算法
CAP原则
Zookeeper的一致性协议
了解哪些其它的一致性协议
算法题:大数组求中位数

2面:
项目
了解哪些blockingQueue,分别有什么特点
算法题:利用blockingQueue设计一个生产者消费者模式,如果是nonBlockingQueue应该怎么修改
了解mysql吗,mysql有哪些索引,知道覆盖索引吗(好像是这个,反正我答的不知道)
spark宽窄依赖

3面:
自我介绍+项目(貌似他不感兴趣,说一半打断我了)
算法题:两个字符串的最大公共子串
使用spark写一个wordcount
从这个spark程序打包提交到spark集群之后,分别发生了什么
spark宽窄依赖,程序中有几个stage
程序中的rdd有几个partition
如果要增加并发应该使用什么参数,executor和core的比例怎么设置(这里我答错了,太久没用都记不清了)
如果发生数据倾斜怎么处理
如果某些task很慢应该怎么处理
一个volatile修饰的变量x,100个线程执行x++,最终结果是多少。
了解哪些java的锁

大概就这么多,3面逮着spark调优一直问。
#面经##字节跳动##大数据开发工程师##校招#
全部评论
楼主你好,请问你是实习、校招还是社招?
点赞 回复
分享
发布于 2020-08-13 21:27
spark wordcount是手撕代码吗还是让用编辑器啊
点赞 回复
分享
发布于 2020-08-13 23:39
小红书
校招火热招聘中
官网直投
楼主你好,volatile那题是什么答案呢
点赞 回复
分享
发布于 2020-08-14 00:05
楼主,那个大数组中的中位数是跟数据流中的中位数的解题思路很像么?是用双堆法么?
点赞 回复
分享
发布于 2020-08-14 11:11
请问一下spark是必备技能咩?这个用的比较少,感觉三面一直在问spark哦
点赞 回复
分享
发布于 2020-08-15 21:47
如果不出意外的话 我会挂在你的三面
点赞 回复
分享
发布于 2020-08-16 14:38
请问楼主面的是data哪个部门
点赞 回复
分享
发布于 2020-08-20 22:34
咋这么多高并发的问题呀?最怕高并发了
点赞 回复
分享
发布于 2021-07-27 23:40

相关推荐

6 50 评论
分享
牛客网
牛客企业服务