美团大数据开发一面
场景题:
1、有一个sql突然执行很慢有什么原因
2、从一个很大的日志表中10T,随机取出一些数据
3、有两个大表join,我说了分桶排序,他说那大key不还是分到一个桶里面,没解决问题,我说讲大key使用mapjoin或加随机数,那key如果未知怎么办
4、mysql中MyIsam相对于innodb更适合那些场景
5、hashmap为什么不直接用红黑树
问一个问题,回答完就会深挖,给我问麻了 #面经#
1、有一个sql突然执行很慢有什么原因
2、从一个很大的日志表中10T,随机取出一些数据
3、有两个大表join,我说了分桶排序,他说那大key不还是分到一个桶里面,没解决问题,我说讲大key使用mapjoin或加随机数,那key如果未知怎么办
4、mysql中MyIsam相对于innodb更适合那些场景
5、hashmap为什么不直接用红黑树
问一个问题,回答完就会深挖,给我问麻了 #面经#
全部评论
4、myisam适合读取频繁更新少的场景,比如新闻。
5、因为树节点所占用的空间是普通节点的两倍,所以只有当节点足够多的时候,才会使用树节点。也就是说,最开始使用链表的时候,链表是比较短的,空间占用也是比较少的,查询性能都差不多,但是当链表越来越长,链表查询越来越慢,为了保证查询效率,这时候才会舍弃链表而使用红黑树,以空间换时间。(来自CSDN:业余码手)
送花
回复
分享
1、宏观:计算资源不足,其他优先级高的任务把资源池占满了。
微观:表数据问题,进了一些数据,造成了数据倾斜等问题。sql有缺陷,比如对分区限制有问题
2、(不确定考察点)limit取?不走mr。
3、大表join,如果表A有数据倾斜,把热点(key数量极大)数据拿出来,热点和非热点数据分别和B表关联。
key未知,我的想法是1用sample取样观察 2用analyze函数看元数据
送花
回复
分享
秋招专场
官网直投
第一题,一个是计算资源,一个是长尾现象
送花
回复
分享
还好吧,感觉像是毕业刚开始面试,问题都很经典
送花
回复
分享
m
送花
回复
分享
spark3的aqe能解决很多问题了,没必要手动处理
送花
回复
分享
感谢大佬分享😂
送花
回复
分享
没有算法题或者SQL题吗
送花
回复
分享
大佬项目是大数据的项目吗
送花
回复
分享
笑死了 估计是一个面试官
送花
回复
分享
mark
送花
回复
分享
楼主 方便问下卡学历吗?
送花
回复
分享
相关推荐
点赞 评论 收藏
转发
查看8道真题和解析
点赞 评论 收藏
转发
05-10 10:13
门头沟学院 计算机类 点赞 评论 收藏
转发
点赞 评论 收藏
转发