美团大数据开发一面

场景题:
1、有一个sql突然执行很慢有什么原因
2、从一个很大的日志表中10T,随机取出一些数据
3、有两个大表join,我说了分桶排序,他说那大key不还是分到一个桶里面,没解决问题,我说讲大key使用mapjoin或加随机数,那key如果未知怎么办
4、mysql中MyIsam相对于innodb更适合那些场景
5、hashmap为什么不直接用红黑树
问一个问题,回答完就会深挖,给我问麻了 #面经#
全部评论
4、myisam适合读取频繁更新少的场景,比如新闻。 5、因为树节点所占用的空间是普通节点的两倍,所以只有当节点足够多的时候,才会使用树节点。也就是说,最开始使用链表的时候,链表是比较短的,空间占用也是比较少的,查询性能都差不多,但是当链表越来越长,链表查询越来越慢,为了保证查询效率,这时候才会舍弃链表而使用红黑树,以空间换时间。(来自CSDN:业余码手)
9 回复 分享
发布于 2023-09-11 23:22 北京
1、宏观:计算资源不足,其他优先级高的任务把资源池占满了。 微观:表数据问题,进了一些数据,造成了数据倾斜等问题。sql有缺陷,比如对分区限制有问题 2、(不确定考察点)limit取?不走mr。 3、大表join,如果表A有数据倾斜,把热点(key数量极大)数据拿出来,热点和非热点数据分别和B表关联。 key未知,我的想法是1用sample取样观察 2用analyze函数看元数据
6 回复 分享
发布于 2023-09-11 23:07 北京
第一题,一个是计算资源,一个是长尾现象
2 回复 分享
发布于 2023-09-17 21:46 浙江
spark3的aqe能解决很多问题了,没必要手动处理
1 回复 分享
发布于 2023-11-12 00:57 广东
m
1 回复 分享
发布于 2023-09-14 16:59 陕西
还好吧,感觉像是毕业刚开始面试,问题都很经典
1 回复 分享
发布于 2023-09-12 12:27 北京
楼主 方便问下卡学历吗?
点赞 回复 分享
发布于 2024-04-18 12:59 江苏
mark
点赞 回复 分享
发布于 2023-10-07 19:54 上海
笑死了 估计是一个面试官
点赞 回复 分享
发布于 2023-09-19 00:56 江苏
大佬项目是大数据的项目吗
点赞 回复 分享
发布于 2023-09-17 16:23 安徽
没有算法题或者SQL题吗
点赞 回复 分享
发布于 2023-09-14 10:46 辽宁
感谢大佬分享😂
点赞 回复 分享
发布于 2023-09-12 11:12 湖北

相关推荐

2025-12-06 01:10
已编辑
哈尔滨工程大学 Java
一面问的真细,二面不知为啥变双机位。9.29快手主站平时怎么学习 AI 的,国内外知名大模型,实习公司都用的什么大模型,怎么评估效果的java池化思想,线程池构造方法的核心参数,线程池中阻塞队列注意事项,submit方法参数和执行逻辑,shutdown和shutdownnow,核心线程允许过期吗threadlocal底层,为什么key是弱引用,key回收了再get或者set这个value会怎样aqs,如何保证公平性java代理java堆划分,新生代还有别的晋升老年代的情况吗,什么时候触发gc,gc失败抛什么异常,如何排查oom,导出dump命令redis数据结构,哪个底层是跳表,和其他数据结构对比布隆过滤器会出现大key问题吗,你咋实现的布隆过滤器你怎么实现redis分布式锁,可重入,续期聚簇索引非聚簇索引select语句会加锁吗,怎么实现的不加锁undolog redolog binlog怎么能让select加锁,update这个范围加的什么锁,update一条呢手撕简单01背包,接雨水10.10快手主站意图识别用的哪个大模型,走到意图和rag的比例,faq是点击的吗自然语言怎么识别的gap一年干啥了,转正怎么样没跟组里提意向吗,研究生研究方向是传统算法吗,会大模型微调吗注册场景为什么用布隆过滤器,原理分布式锁底层的key怎么拼的,value里是什么redis持久化zset底层mysql索引结构,一个表三个字段有主键唯一索引和没索引的字段会有几个b+树,聚簇索引非聚簇索引存的啥无手撕
点赞 评论 收藏
分享
评论
23
194
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务