字节 社招大数据 已拿offer 还愿

一面:
根据项目问了架构,涉及到的技术
spark streaming Vs flink
watermark是干什么的,如何使用
数据倾斜如何处理
编程原则Solid
Spark reducebykey和groupbykey的区别
mysql 索引相关,B+树,聚簇索引等,回表
Kafka 原理 高可用
算法:中文数字专阿拉伯数字
二面:
项目:重点讲一个,其中的架构,技术等
spark streaming vs structured steaminng vs flink 差别,flink checkpoint,barrier等,扩展到谷歌millwhile, dataflow等模型
Kafka 高可用如何保证,幂等性如何保证exactly-once。为什么性能好
其他的记不清了,多是大数据相关
算法:数组中 乘积最大的三个数,有负数,零的情况。排序后处理,复杂度分析
三面:(痛苦来了)
聊了很多现在公司业务问题
场景:三个节点日志,每个节点两千万,有时间和IP等信息,如何设计系统查询一个时间 范围内top10的IP,要求快速响应
想的是:通过flink或flume刷到mysql,然后groupby count。但是面试官问的特别详细,比如,flink如何读数据,什么原理……,怎么写入mysql,怎么存,一天6kw,10天6亿数据,分库分表?,怎么连接mysql……groupby怎么做,count怎么做……
问的相当崩溃,最后如何及时响应用户请求,通过sql groupby 过后rollup,卷数据。触及知识盲区了。
最后问了一些项目和管理中的问题,个人优势啥的
四面:
离职愿意,个人规划,薪资等

offer已拿, 还愿
感谢牛客

#面经##社招##字节跳动##大数据开发工程师#
全部评论
楼主是社招?
点赞 回复
分享
发布于 2021-05-13 14:51
楼主可以加个微信吗
点赞 回复
分享
发布于 2021-05-13 17:27
小红书
校招火热招聘中
官网直投
想问下楼主是工作几年了,明年我也打算试试字节社招😂
点赞 回复
分享
发布于 2021-05-14 11:37
楼主你这面的是数据平台开发,还是数据开发?
点赞 回复
分享
发布于 2021-05-15 16:19
楼主我想问下,字节数据研发工程师又面过吗,一般会问什么样的问题,会跟你上面描述的一样吗
点赞 回复
分享
发布于 2021-05-19 16:26
楼主牛逼!
点赞 回复
分享
发布于 2021-05-24 20:09
薪酬审批用了几天啊
点赞 回复
分享
发布于 2021-05-26 16:44
大佬整个流程走了多久呀
点赞 回复
分享
发布于 2021-06-05 12:52
感谢大佬反馈 得好好学习
点赞 回复
分享
发布于 2021-06-12 15:35
楼主从开始面试到拿到offer多久?面试是远程面试吗,编码平台是啥?麻烦楼主解答一下,谢谢啦
点赞 回复
分享
发布于 2021-06-17 13:04
老师 字节数据开发岗对学历有什么要求么?
点赞 回复
分享
发布于 2021-06-28 03:47
这个数据量写入mysql 查询不会很慢吗?如何做到快速响应呢?
点赞 回复
分享
发布于 2021-07-05 19:59
第四面是hr面,还是技术面
点赞 回复
分享
发布于 2021-11-13 22:57

相关推荐

快手电商-支付交易 后端 n*16
点赞 评论 收藏
转发
 适合小白或者其他领域转Flink或者轻度使用者查看,大佬轻轻喷基础篇1. 什么是Apache Flink?​Apache Flink是一个开源的流处理和批处理框架,可以实现快速、可靠、可扩展的大数据处理。​2. Flink与Hadoop的区别是什么?​Flink是一个全面的流处理和批处理框架,提供了低延迟和高吞吐量的实时数据处理能力,而Hadoop更侧重于离线批处理。​3. Flink中的事件时间(Event Time)和处理时间(Processing Time)有什么区别?​事件时间是数据实际生成的时间,而处理时间是数据到达Flink系统的时间。事件时间可以通过时间戳标记数据,而处理时间是Flink根据数据到达的顺序生成的。​4. Flink的容错机制是如何实现的?​Flink使用检查点(Checkpoint)机制实现容错。它会定期保存应用程序的状态,并在发生故障时恢复到最近的一个检查点状态。​5. 什么是Flink的窗口(Window)?窗口是Flink中用于对无限数据流进行有界处理的机制。它将无限流切分为有限的、不重叠的块,并对每个窗口进行计算。6. Flink支持哪些类型的窗口?​Flink支持滚动窗口(Tumbling Window)、滑动窗口(Sliding Window)和会话窗口(Session Window)。7. Flink中的状态后端(State Backend)是什么?​状态后端是Flink用于保存和管理应用程序状态的机制。它可以存储状态到内存、文件系统或分布式存储系统(如HDFS)中。8. Flink的水印(Watermark)是什么?​水印是用于表示事件时间进度的标记。它通常与数据流中的时间戳一起使用,用于处理乱序事件和延迟数据。9. Flink的时间窗口触发器(Trigger)是什么?​时间窗口触发器用于控制何时触发计算窗口的输出。它可以基于元素数量、处理时间、水印等条件进行触发。​... 完整版见:原文链接:https://blog.csdn.net/qq_30757161/article/details/137459710#数据开发##金三银四,你有感觉到吗##大数据#
点赞 评论 收藏
转发
13 101 评论
分享
牛客网
牛客企业服务