顺丰 大数据 一面二面 凉经
28min 一位很友好的大哥,感觉问的比较简单全程没有怼我,希望不是KPI面😓
一面
开问:
- 自我介绍?
- 介绍Spark 项目?
- 介绍数据仓库项目,怎么建模怎么分层的?
- 数仓分层的优点在哪里?
- 项目里面提到了留存率,你怎么计算留存率的?
- TCP说一说?
- TCP和UDP区别说一说?
- A 3条数据,B 4条数据 A left join B 结果会有几种情况?
- 双流join 讲一讲?
- 缓存过多你的解决思路是怎么样的?
- Flink 了解吗?讲一讲?
反问:
- 工作难点?数据来源和种类很多,需要做质量保证?预处理好像是
- 技术发展方向?无代码化,拖拽方式。HiveSQL、SparkSQL、Presto、ClickHouse、Flink 目前技术栈。
总结:
面了这么多家感觉大家用的技术栈都差不多,主要是场景不一样。
二面
部门leader,很友善的大哥! 35分钟
自我介绍
介绍下Spark 项目
介绍下Exactly-Once 机制你是如何实现的?
场景题目:Hive 中有很多重复的数据,你如何去重?
聊聊MySQL 吧
- char 和 varchar 的区别?
- 自增主键,插入十条数据,删除两条,重启后再插入一条数据,这条数据的id 是多少?为什么
看你会Docker 说说适用场景?
会K8S 吗?
看你简历上技术栈写了会Hbase,说一说Hbase 和 MySQL 的区别?
说的不咋地,那你再说说行式存储和列式存储的区别吧?
反问
- 个人建议
- 你觉得大数据开发中的难点是什么?
这此面试有点不寻常。考察的都是之前我认为不会考到的点,加粗的地方都没答上来(🤣🤣,卧槽这么一看基本全部的问题都没回答上来),面到流汗。如果被挂我也接受。
但是!这位大哥超友善交流起来很舒服,不会的地方没有怼我,反而都会告诉我答题的思路。还和我分享了做大数据的个人职业规划和发展路线。给了我今后学习的方向。超级感谢!!!
#顺丰科技##大数据开发工程师#
查看20道真题和解析