字节大数据开发一面

1.自我介绍
2.实习介绍
3.实习工作内容下游使用方主要有那些?
4.AI团队数据支持 他们使用这个数据做的什么
5.除了对表的支持之外,是否在计算层面做过一些优化
6.boradcast join和sortmergeJoin的区别和 使用场景的不同

然后面试官开始说,我觉得概念你应该都会,我就不问你了,所以我后面会从场景的角度去考验你的技术理解,本人听到这里心凉了半截,因为两段实习全是离线,这里全程拷打实时

7.FLink窗口30s 步长5s 窗口触发的时间是在5s触发还是30s之后触发
8. 如果说这个任务是从checkpoints恢复出来的 那他第一次是在5s之后触发还是30s
9.Flink 之中窗口的计算大多时候会导致整点进行触发(有可能导致很多不同的任务再同一个时间段使用资源导致资源紧张),你如何避免窗口不在整点进行触发呢
10.Flink的状态有哪些
11.valueState 和 keyState的区别  这一步回答的不太好,说想问的是这两个在使用场景上的不同
12.上游是kafka 中间存在shuffle,晚高峰出现lag 你该怎么解决 说的提高并行度
13.如果是kafka单个partition导致的lag 你该怎么解决呢 回答的窗口触发计算使用预聚合、kafka提高分区数 进而让下游Flink也提高并行度,回答的貌似不太满意,之前一直做的离线,实时确实不太会
14 kafka如何保证的数据不重复且不遗漏
15 kafka那些手段保证了吞吐量这么大

后续开始拷打计算机基础,os和计算机网络一点没复习,心理更凉了

16 操作系统进程通信有哪些方式    说了有管道和SharedMemory这几种
17 是否了解SharedMemory的实现
18 socket是否有了解 说了下socket以及spark使用netty这种通信架构
19 netty 在spark怎么使用的
20 close wait状态的理解

这里计网和os回答的不太好,开始怀疑是否是计算机科班出身

21 java的HashMap底层如何实现的
22 HashMap的数组能使用arraylist来实现吗
23 二叉树的锯齿状遍历(需要自己构建TreeNode和输入输出)自己写了20分钟 写了个reverse的版本,面试官不满意,最后口述了个双端队列的思路(减少reverse的遍历)

感觉这轮面试又G了,我不知道这是不是字节的正常难度,每次面试字节都是高强度拷打,有点自闭了
全部评论
感觉在b站上看到过这个团队的flink技术应用汇报
1 回复 分享
发布于 2024-09-20 12:16 北京
你这个是数仓吗?
点赞 回复 分享
发布于 2024-10-07 16:53 广东
问的flink那部分工作中比较常用,另外直播是偏向于实时链路,所以问实时多一些
点赞 回复 分享
发布于 2024-10-05 19:54 北京
看了眼主页,大佬
点赞 回复 分享
发布于 2024-09-24 10:07 北京
统一说一下,已经挂了
点赞 回复 分享
发布于 2024-09-21 11:35 广东
佬现在啥情况
点赞 回复 分享
发布于 2024-09-21 10:29 湖北
天呐,感觉难度好大。。。是抖音直播吗
点赞 回复 分享
发布于 2024-09-14 15:49 辽宁
方便的牛友们评价一下难度呗,面字节面的已经有点自闭了,第四个部门了已经
点赞 回复 分享
发布于 2024-09-13 21:59 广东

相关推荐

bg 9本硕,某团暑期实习。记录一下80分钟:5分钟1. 自我介绍35分钟2. 了解实习经历3. 针对实习项目,问数据层次怎么分层4. 数据分层的作用5. 针对具体实习项目,说明业务逻辑6. 说明实习项目的“订单量”这个指标从源头到产出的ETL过程7. 针对实习项目,复盘后最大的难点是什么8. 复盘之后有什么收获9. 你刚才说复盘收获是处理小文件,那么spark怎么处理小文件的?10. 处理小文件有哪些方法,举例子11. hive冷热分离的方法12. 你刚才提到了组里有做ec存储,你了解ec存储吗13. 暑期实习有什么感受,转正了吗15分钟14. 了解spark的semi join吗,他是干嘛的15. 了解spark的AQE,这是什么16. 你刚才讲AQE提到了广播机制,这个在spark中很重要,讲讲广播过程呢17. 了解网络吗?讲讲三次握手和四次握手区别。18. 了解数据结构吗?讲讲O(nlog n)的不稳定排序算法。20分钟两个编程题:Q1.求开方:给定num=5.79,error=1e-8,求x使得abs(x^2-num)<error19. 先讲讲思路吧,有什么思路:二分O(log n)20. 刚开始没做出来,面试官提示了下细节21. 后面二分法做出来了,面试官说那如果num小于1有什么变化呢22. 面试官问还有什么方法吗:牛顿下山法23. 公式写上去,但是面试官不关心公式,关心原理:会无限逼近24. 如果是三次方四次方,牛顿下山怎么用呢,公式会变的Q2.1TB的int类型数据怎么在512MB的虚拟机中求中位数25. 已经70分钟了,没时间了,没要求写代码,只要讲思路:外部排序,归并思想26. 面试官问还有什么方法吗:没想到了,但是后面搜了下有分布式排序,mapreduce排序等,估计想让我回答spark相关的,但是真不知道。5分钟反问27. 反问业务、作息、感受:都是套话28. 反问可以提升的点、我的不足:涉及到应聘者的评价,不能说。29. 谢谢面试官勒,吃饭去咯。
查看26道真题和解析
点赞 评论 收藏
分享
评论
10
54
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务