小耗子呀 level
获赞
21
粉丝
23
关注
8
看过 TA
595
National University of Singapore
2025
大数据开发工程师
IP属地:浙江
暂未填写个人简介
私信
关注
3.26 美团 数据开发 到店(暑期实习二面)- 面试官是一个温柔的小姐姐- 自我介绍- 之前工作经历介绍- 你觉得什么是好的数仓- 要达到你说的好数仓的标准,应该如何建设?- 小文件具体怎么治理的(预防/滚动式 + 自动脚本)- 小文件有哪些危害- 给你一个数据倾斜的场景,可能有点难,答不出来也没事:大表 Join 大表(10 亿级别的,比如订单 Join 商品表)可能有一些商品销量特别好,数据倾斜,要如何解决?(采样热点 key,一张表 1-N 加盐,一张表扩容 N 倍)- 上面的题是美团的数据倾斜经典问题了,具体可以参考他们自己的技术博客:[Spark性能优化指南——高级篇 - 美团技术团队 (meituan.com)](https://tech.meituan.com/2016/05/12/spark-tuning-pro.html)- 更熟悉 Java 还是 Python?写一个冒泡排序- 写一道 SQL:SQL276 牛客的课程订单分析(六)- 讲一个你之前项目中遇到的一个困难,你是如何解决的- 讲一个你的缺点- 假如这次面试失败,你觉得会是什么问题- 你是如何学习新知识的- 国外工作还是选择回国- 什么时候能够实习- 反问:具体做什么业务的?到店-数据智能(好像是),最近在做的项目是特价团购,面试官说了超级多,离线、实时数仓建设、数据分析、数据应用都有,然后总结说是个好组好业务(“可以去看财报”)。- 反问:只有两面吗?面试官:对。什么时候可以知道结果?面试官:一周之内。🍡团子拜托啦  许愿 OC----------------------------Update:4.1 OC + Offer 邮件我直接一手接受 Offer!感谢团子🍡😎
0 点赞 评论 收藏
转发
- 美团:到店事业群--平台技术部(暑期实习一面)- 上来面试官说看你简历挺匹配的,I'm like whaaaaat- 自我介绍- 为什么去读研了- 你们团队多少人- 你们数仓怎么分层- 你主要负责哪几层- ODS 数据从哪来,怎么接入数仓- ODS 表是什么事实表类型?更新方式?- ODS 到 DWD 做了哪些处理?- DWD 有哪些表,事实表如何设计的?- 你提到了数据字典,解释一下- 通过什么实现的(数据资产管理的平台)- 数据库 vs 数据仓库- 数据库为什么要减少冗余(数据更新导致数据不一致)- 数据仓库有冗余,如何保证一致性(我讲的更多需要人为的干预+平台功能)- 数仓分层的意义- Spark 的 stage 是如何划分的- 哪些算子会出现 Shuffle- 小文件优化,小文件是怎么产生的- Map 端造成的小文件问题怎么处理- 表存储优化:小文件治理、生命周期治理、下线无用表- 生命周期治理是每一层生命周期不同吗,考虑哪些方面- 分桶表的场景- MySQL 的索引一般是用什么数据结构- 介绍 B+ 树- 索引匹配原则- 写一个 SQL:[SQL270 考试分数(五)](https://www.nowcoder.com/practice/b626ff9e2ad04789954c2132c74c0513?tpId=82&tqId=35496&ru=/exam/oj)- 反问:部门业务?美团数仓建设?公司平台建设情况?- 感觉面试官明显对数仓建设、数据治理、数据一致性之类问题更感兴趣,Hive、Spark 之类的框架八股基本没问,算法题更是都没出,只出了一道中位数的 SQL(然后我写的 SparkSQL 牛客网还跑不了,面试官 be like 没事,差不多就行了 -_-||)- 心路历程:第一次面试有点紧张,虽然问题都非常简单,但我很多地方表达的不是很顺畅,有几个问题一开始都没 get 到面试官的点,感觉情况不太乐观。面试官很好,奈何我不够给力,哈哈。许愿二面 😥-------------------------------------------Update:3.25 刚刚收到电话约了二面Update:字数不够了,二面面经在动态
0 点赞 评论 收藏
转发
牛客网
牛客企业服务