美团大数据开发一面

场景题:
1、有一个sql突然执行很慢有什么原因
2、从一个很大的日志表中10T,随机取出一些数据
3、有两个大表join,我说了分桶排序,他说那大key不还是分到一个桶里面,没解决问题,我说讲大key使用mapjoin或加随机数,那key如果未知怎么办
4、mysql中MyIsam相对于innodb更适合那些场景
5、hashmap为什么不直接用红黑树
问一个问题,回答完就会深挖,给我问麻了 #面经#
全部评论
4、myisam适合读取频繁更新少的场景,比如新闻。 5、因为树节点所占用的空间是普通节点的两倍,所以只有当节点足够多的时候,才会使用树节点。也就是说,最开始使用链表的时候,链表是比较短的,空间占用也是比较少的,查询性能都差不多,但是当链表越来越长,链表查询越来越慢,为了保证查询效率,这时候才会舍弃链表而使用红黑树,以空间换时间。(来自CSDN:业余码手)
9 回复
分享
发布于 2023-09-11 23:22 北京
1、宏观:计算资源不足,其他优先级高的任务把资源池占满了。 微观:表数据问题,进了一些数据,造成了数据倾斜等问题。sql有缺陷,比如对分区限制有问题 2、(不确定考察点)limit取?不走mr。 3、大表join,如果表A有数据倾斜,把热点(key数量极大)数据拿出来,热点和非热点数据分别和B表关联。 key未知,我的想法是1用sample取样观察 2用analyze函数看元数据
6 回复
分享
发布于 2023-09-11 23:07 北京
滴滴
校招火热招聘中
官网直投
第一题,一个是计算资源,一个是长尾现象
2 回复
分享
发布于 2023-09-17 21:46 浙江
还好吧,感觉像是毕业刚开始面试,问题都很经典
1 回复
分享
发布于 2023-09-12 12:27 北京
m
1 回复
分享
发布于 2023-09-14 16:59 陕西
spark3的aqe能解决很多问题了,没必要手动处理
1 回复
分享
发布于 2023-11-12 00:57 广东
感谢大佬分享😂
点赞 回复
分享
发布于 2023-09-12 11:12 湖北
没有算法题或者SQL题吗
点赞 回复
分享
发布于 2023-09-14 10:46 辽宁
大佬项目是大数据的项目吗
点赞 回复
分享
发布于 2023-09-17 16:23 安徽
笑死了 估计是一个面试官
点赞 回复
分享
发布于 2023-09-19 00:56 江苏
mark
点赞 回复
分享
发布于 2023-10-07 19:54 上海
楼主 方便问下卡学历吗?
点赞 回复
分享
发布于 04-18 12:59 江苏

相关推荐

21 166 评论
分享
牛客网
牛客企业服务