滴滴 数开 日常实习一面

项目
说一个你最熟悉项目,你在这里面主要在做什么工作
离线主要写的是这种 Spark SQL 是吗?
spark问题排查与优化
我给你一个这个实际的场景吧。比如说你的一个任务,之前就是每天大概30分钟就能跑完,现在突然跑了两个小时,然后对于这个情况,你的分析以及定位解决的思路是什么样的?
那你怎么判断出它确实是倾斜的呢?
那看到这个 tasks 倾斜之后呢?你会怎么去解决?
OK,刚才你说的是这个解法啊,就是现在的话,就是说你知道了这个,stage 也倾斜了,那你怎么我知道,是你这个 sql 里面,可能你这个 sql 比较比较长,对吧?发生倾斜的可能是有 join、group by 很多很多种情况。那你这个你这个很长的 sql 里面可能有很多的 join 很多的 group by 那你怎么知道是哪段 sql 发生倾斜的呢?
你说的具体是 Spark 的哪个?UI 的哪个界面啊就是这 Spark UI 界面你之前看过是吧?有没有深析?有没有深入的研究过这个上面的一些指标的含义?以及每个页面它具体承载了哪些信息?
那你说一下这个 spark 任务的一个大概的提交流流程是什么样的?
最后就是一道sql题并且讲述解题逻辑
求10分钟内连续下单的order_id
全部评论
大佬 滴滴一共几面
点赞 回复 分享
发布于 01-18 15:53 韩国
滴滴大佬,oc了吗
点赞 回复 分享
发布于 01-09 11:54 广东
楼主Spark项目经验丰富啊
点赞 回复 分享
发布于 2025-11-14 11:24 广东
耐面王
点赞 回复 分享
发布于 2025-11-14 11:23 北京
耐面王
点赞 回复 分享
发布于 2025-11-13 16:13 安徽
之前面网约车挂了
点赞 回复 分享
发布于 2025-11-13 15:58 安徽

相关推荐

2025-12-06 01:10
已编辑
哈尔滨工程大学 Java
一面问的真细,二面不知为啥变双机位。9.29快手主站平时怎么学习 AI 的,国内外知名大模型,实习公司都用的什么大模型,怎么评估效果的java池化思想,线程池构造方法的核心参数,线程池中阻塞队列注意事项,submit方法参数和执行逻辑,shutdown和shutdownnow,核心线程允许过期吗threadlocal底层,为什么key是弱引用,key回收了再get或者set这个value会怎样aqs,如何保证公平性java代理java堆划分,新生代还有别的晋升老年代的情况吗,什么时候触发gc,gc失败抛什么异常,如何排查oom,导出dump命令redis数据结构,哪个底层是跳表,和其他数据结构对比布隆过滤器会出现大key问题吗,你咋实现的布隆过滤器你怎么实现redis分布式锁,可重入,续期聚簇索引非聚簇索引select语句会加锁吗,怎么实现的不加锁undolog redolog binlog怎么能让select加锁,update这个范围加的什么锁,update一条呢手撕简单01背包,接雨水10.10快手主站意图识别用的哪个大模型,走到意图和rag的比例,faq是点击的吗自然语言怎么识别的gap一年干啥了,转正怎么样没跟组里提意向吗,研究生研究方向是传统算法吗,会大模型微调吗注册场景为什么用布隆过滤器,原理分布式锁底层的key怎么拼的,value里是什么redis持久化zset底层mysql索引结构,一个表三个字段有主键唯一索引和没索引的字段会有几个b+树,聚簇索引非聚簇索引存的啥无手撕
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务