个人bg:双非+0实习经历+两个相关项目 面试时间:2023年国庆后 已oc但没去,目前找到一个比较满意的实习就把之前的面经都发发一面 自我介绍介绍实时项目你们项目的数据量是多大你们项目中有遇到什么性能问题嘛两道算法题两数之和数组的小和spark如果要读取两份相同的数据怎样做spark参数调优这个得重点了解一下scala有什么算子可以去重我答了distinct,面试官追问如果是对几个列进行去重呢,寄,忘记了对数据清洗有什么了解对数仓分层有什么了解数据倾斜怎么处理hive掌握程度spark掌握程度二面 有点记不太清了,主要是针对spark进行提问,如果有意向的话记得提前复习spark相关知识