2022-05-09 美团大数据开发暑期实习一面

  1. 相互自我介绍

  2. 数据怎么落到数仓里的?做了哪些加工处理?最后怎么给到应用层的?

  3. mock出来的数据是怎么抽取过来的?抽取过来的数据存到哪了?

  4. 在这个过程中数据是怎么处理的?

  5. 项目中的数仓分层觉得是合理吗?

  6. 写入外存,为什么选择Redis、HBase、ClickHouse

  7. 数仓为什么要进行分层

  8. 在此之前接触过数据仓库吗

  9. 数据仓库和数据库有什么区别

  10. 粒度和维度是一个事情吗?它们有什么区别?比如说我们有一张订单表,订单表里可能会记录订单id、用户id、门店id、订单金额、支付时间等,表的粒度是什么?可以从哪些维度分析这张表?

  11. 数据仓库的主题概念了解吗?

  12. 离线数仓的经验,离线数仓和实时数仓的区别

  13. 实时数仓的准确性如何保证?如果数据不准确的话可能是什么原因导致数据不准确?集群保证稳定的情况下哪些环节会丢数据?

  14. 大概讲一下MapReduce的工作过程

  15. 整个MapReduce工作过程中有几次排序操作?用到的排序方法是一样的吗?

  16. 平时有用到关系型数据库吗?

  17. 美团日志数据--大表--关系型数据库大表查询性能优化

  18. 索引的概念,MySQL的索引实现方式,B+树索引和哈希索引的对比

  19. case:美团日志信息表,用户id、时间、页面id、性别、年龄,这个表在哪些字段上建立索引比较合适?在性别上建立索引合适吗?

  20. Hive处理数据的时候遇到过什么问题?数据倾斜

  21. 数据倾斜怎么产生?

  22. 为什么不同数据类型的关联会产生数据倾斜?

  23. 数据倾斜有哪些解决办法?

  24. Hive转换成MR任务之后是怎么体现出来数据倾斜的?怎么从MR层面去解决数据倾斜?

  25. 所有场景都适合MapJoin吗

  26. 做两个题:

  • 归并排序

  • SQL列转行、行转列、平均分大于90分的学生、每科排名第一名的学生

  1. 反问
#面试复盘#
全部评论
实习的,面试的都这么难啊
点赞 回复
分享
发布于 2022-05-10 21:03
感谢分享!
点赞 回复
分享
发布于 2022-05-11 09:07
阅文集团
校招火热招聘中
官网直投
美团面个实习都这样难
点赞 回复
分享
发布于 2022-05-13 11:19
你好,请问有二面面经分享下吗
点赞 回复
分享
发布于 2022-05-14 17:55
请问是跟着尚硅谷做的项目吗
点赞 回复
分享
发布于 2022-05-15 21:32
请问一下楼主是本科还是研究生呀,感觉问的问题好难
点赞 回复
分享
发布于 2022-05-16 22:00
离线数仓学到哪里就行,需要spark和flink吗
点赞 回复
分享
发布于 2022-05-26 18:59
离线数仓问题怎么准备的老哥,看完视频感觉有点蒙
点赞 回复
分享
发布于 2022-06-07 15:28

相关推荐

9 64 评论
分享
牛客网
牛客企业服务