首页 / 数据开发面经
#

数据开发面经

#
8438次浏览 99人互动
此刻你想和大家分享什么
热门 最新
蔚来一面面经
数据开发岗 秋招第一个面试,被狠狠拷打了1.spark和flink有哪些共性和区别2.你说到flink是一条数据一条数据的处理,那我们要对以前数据做聚合会怎么处理(状态机制)3.状态怎么进行恢复和使用(checkpoint机制,下游二阶段提交)4.为什么会有二阶段提交5.了解过二阶段提交机制怎么实现吗6.两阶段提交是保证卡夫卡提交和checkpoint机制同时完成,怎么去保证这个事情,状态保存在哪里7.flink针对kafka是怎么去传递两阶段结果的8.对spark有哪些自己的理解9.spark为什么能处理大规模数据集(高并发)10.多台机器处理,内存是比较宝贵的,数据过大,内存放不下怎么处理(写盘)11.spark当中结点分为那些类型12.大规模数据集,不断落盘,是写到同一个磁盘文件还是多个磁盘文件13.spark中间会一直生成小文件,如何处理14.什么是OOM,什么时候会出现OOM15.怎么去定位OOM出现在哪16. jvm, 内存模型17.spark SQL怎么执行(任务调度)18.底层资源调度是什么资源19.程序运行,内存放的什么东西,怎么管理内存,内存分配20. MySQL执行引擎21.什么是聚簇索引22.为什么要回表,什么样的操作会回表23.介绍什么是b+树24.知道平衡二叉树吗,什么是二叉树25.精准一次语义,kafka中有那些语义26.java这一块熟悉哪些内容,对java这块实现数据结构了解那些27.hashmap底层怎么实现,怎么去实现不可重复的,如果重复了怎么处理。hashcode和equals方法有什么区别和联系,如何判断是否和现有的key相同28.线程安全问题,什么是线程安全29.主要课程包括哪些30.大模型这块,transform架构了解过吗,用来做什么31.SQL题,求班级TOP5学生信息32.SQL锁机制,多个用户同时去写一条数据33.锁机制和事物区别34.什么是悲观锁什么是乐观锁35.乐观锁怎么实现36.进程和线程有什么区别,怎么去调度线程/进程运行,了解过协程吗37.一个进程中包含哪些部分,哪些数据38.讲一下堆和栈,栈有哪些应用反问后续,9.26约二面
点赞 评论 收藏
分享
虾皮一面
数开岗,面的非常愉快一开始先介绍了面试流程1.自我介绍,挑实习经历讲一讲2.代码手撕3.八股考察4.QA环节直接介绍实习经历,没有自我介绍,讲了10分钟开始手撕。1.数据是真实数据吗2.来源系统是同一个系统吗了解了一下主要做的项目数据来源手撕:问了下比较熟的编程语言(java)连续子数组最大和多少知道虾皮是干嘛的吗SQL  求销量表,每个类别下售量TOP10的商品id排名连续怎么做衣服这一品类数据量特别多,导致数据倾斜怎么处理,只针对这一场景处理(二次聚合)给谁加随机值,怎么加,举例还有别的方法吗,只针对这个情景(压缩)你知道spark有做这件事吗(压缩)自己工作中会开这个配置吗spark和flink哪个比较熟,或者其他组件哪个学的好,可以自己挑个熟悉的来讲,还是随便挑个问1.flink状态后端知道哪些2.讲一下checkpoint是在干嘛3.如果状态后端是Rocksdb,checkpoint是怎么存的4.一个算子是怎么知道自己该做checkpoint5.从checkpoint恢复的时候,怎么做的6.一个算子,怎么知道恢复时应该读哪份文件7.看过checkpoint文件里面的结构吗8.有遇到过从checkpoint恢复时失败,是由于算子找不到从哪恢复的问题吗spark方面的问题1.executor, 他的内存分成几部分?堆内堆外内存区别为什么会有堆内堆外内存2.在shuffule的过程中,这几部分是否/如何参与其中3.节点0OM,我有哪些方法或者配置,去优化?最后反问总结,面试官全程态度超好,一直在说别着急,没问题,会有正反馈,体验最好的一次面试
查看29道真题和解析
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客网在线编程
牛客网题解
牛客企业服务