高德 数据开发

#面试问题记录#
前2天面试了高德,面试问题如下
1 先自我介绍
2 挑一个你做的很好的项目描述一下,突出其中的技术点和难度
3 对于实时数仓你这边的技术选型,为啥需要选这一套,优缺点是啥
4 对于目前的湖仓你这边是怎么用的,比如对于一条日志流数据,后续有很多下游,既要实时和离线,你会怎么考虑接近这个日志数据
5 对于olap引擎索引一般都是怎么用的,你平时用的话有什么考虑,对于索引有啥要求吗
6 对于数据治理你这边怎么看,数据治理主要优先考虑哪几个方面,收益怎么体现
7 对于一个新的业务你来设计一套数据基建主要从哪方面入手,如何考虑后续的高扩展性
8 你平时用ai吗ai主要是用在哪些方面,对于ai能起到提效的作用吗
9 有啥需要找我了解吗
全部评论

相关推荐

从25年2月到现在,接触大数据开发已经有一年了,从MySQL,orcal,到flink首先就是写SQL,毕竟大家大部分都是SQLboy,SQLgirl,SQL是基础,可以在力扣牛客上多刷题。手撕常考!数开作为技术岗中最贴近业务的岗位,理解业务过程并进行数仓建模是最重要的一部分建模这块主要涉及,指标维度建设,数仓分层,讲解项目结合业务来讲.技术栈主要分离线和实时,实时门槛工资相对高一点,但应用场景比离线少很多,离线是数仓的基础。大数据技术栈主要是Hadoop生态圈,分布式的一些东西,也就是八股基础的得会,得理解整个架构运作流程,光背是记不住的Hadoop,hive,spark离线最核心的技术栈,也是八股最常考的,实时主要是spark,flink其次是一些数据处理框架kafka,etl转换工具知道一些,怎么用的大数据的框架搭起来比较麻烦,时间赶的不建议亲自搭环境,理解项目业务过程,这个项目做了什么,整个数据链路能讲清楚即可。技术栈的一些相关学习渠道,博主是在B站上找视频学的,也够用,时间赶学重点就行,结合八股来看。最后是算法手撕,本人算法很烂,除了大厂基本不考这个。出的题一般比较简单,会hot100就行个人经验来看,简历上有了实时项目,很少问Hadoop八股,更偏重spark和flink。项目还是以离线为主。实习发现实时数据只占很少一部分,离线是底盘有了实习经历就不咋问项目了
为了入行xx岗,我学了_...
点赞 评论 收藏
分享
评论
2
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务