蔚来 大数据开发 一面凉经

1.为什么要往Kafka里写处理结果?

2.Flink,Kafka如何做到数据不丢失

3.Flink,Mysql又要如何做到数据不丢失

4.Spark如何做到权限控制

5.讲讲你对Spark最了解的地方

6.做大数据平台,同时两个人要提交SQL,处理数据,应当怎么做

7.在Spark里自定义算子,如何判断算子是不会导致依赖错误,后续补充为,如何判断DAG还是DAG,不会形成环

算法:判断链表是否有环

只记得这么多了,面试官人很好,不会的会提示,实在不会的也会回答。
遇到的最难的面试,人麻了。
反问面试官如何在面试里能够比较好地回答场景题
面试官说还是要注重知识的广度,评价广度不够,深度也不够,对于大数据停留在一个比较浅显的了解上,应当静下来心来学习

#春招上岸经验##蔚来汽车##面试题目#
全部评论
五分钟之后约二面,代码题不会写,挂了
1 回复 分享
发布于 2022-03-12 17:37
第7题,没看懂啥意思
点赞 回复 分享
发布于 2022-03-16 10:13
蹲一蹲6,7题的思路
点赞 回复 分享
发布于 2022-03-13 21:17
我也炸了,二面lru在和面试官讲思路时感觉有点奇怪,想着可能写不对,请求换题,结果直接跳过了,后面题也没答好,崩了
点赞 回复 分享
发布于 2022-03-12 19:03

相关推荐

6.20一面自我介绍,项目拷打,数据倾斜的发现,以及如何做的,计算过哪些指标,场景题:计算2024-01-01至今商品的点击率,为了计算该指标,dwd层和dws层该如何构建sql题:将连续的时间展开user_id,s_date,e_date,输出user_id  date_time,求三日内留存率与三日留存率耗时40分钟6.23二面,自我介绍,项目拷打 这里感觉面试官 认为我对项目的理解不够深入,聊了一半开始做题,sql:连续登陆领金币问题,直播间峰值做完题又随便聊了聊,耗时40分钟6.26 加面三面,被面试官狠狠拷打,先拷打项目,先问数据倾斜,join产生数据倾斜该怎么处理,两个小表之间join,产生数据倾斜你有什么好办法,然后延展,两个大表之间join,产生数据倾斜你又有什么好办法。在问spark对比hadoop好在那里,一不小心答到了sparkAQE,在延伸小文件问题,小文件问题除了查询比较慢还有什么其他的坏处这里答道元数据过多,会引起查询慢,直接延伸目录树的存储方式,再来一个场景题 给你1t的内存存储800个g的元数据,你有什么疑问,reduceByKey、groupByKey、combineByKey等几个ByKey算子的区别,并且 combineByKey需要传入几个参数,然后spark 火焰图了解吗?count(distinct user_id) 用spark 怎么写,一道sql题,编程题看我没有刷过力扣直接没出,面试很有难度,特别多场景题,预估是挂掉了,被面试官面到一半汗都出来了,期间穿插各种spark源码相关问题,以及问我有没有看过spark源码。耗时80分钟oc
查看19道真题和解析
点赞 评论 收藏
分享
评论
6
28
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务