10.4-传化智联-数仓-一二面

一面

9.24

面试时间:30min

自我介绍

实习介绍

数仓分层?

ODS层怎么分区的?多久清理一次?

DWD层做了那些工作?

数据清洗怎么搞的?清洗掉了那些字段?为啥要清洗这些?后面不会用吗?如果后面的指标需要用怎么办?

怎么脱敏的?UDF怎么用?除了UDF还有什么方式?

维度退化是怎么做的?为什么要这样做?

宽表都在那一层?

开窗函数用过那些?rank,dense_rank区别?

lead,lag区别?

内部表和外部表区别?

MapReduce介绍一下?shuffle作用?

Hadoop组成?

2NN再介绍一下?

NameNode挂掉后怎么重启?

Spark了解多少?

Spark的缺点?

SQL题:口述分组topN,不用开窗函数能实现吗?

HR询问:

为啥想来杭州?

本科学校啥层次?

有其他offer了吗?为什么选择我们公司?

有学生干部经历吗?

反问:流程?

这次的面试官似乎对我实习的项目不太感兴趣,反而是怼着我自学的sgg数仓使劲问

二面

10.4

面试时间:30min

面试官和HR在一起问,这次没自我介绍

讲一个你最近做的项目?

深挖项目细节,数仓主题?数据链路?讲一个具体的链路过程?指标体系?

一个场景,应该如何建模?

参加过的比赛,团队赛扮演的角色?

论文相关的问题。

HR常规询问

全部评论
数据脱敏可不可以做个映射维表(权限高点,一般人查不了那种)?
点赞 回复
分享
发布于 2023-10-13 15:52 上海
哥们,问一下笔试内容难不难
点赞 回复
分享
发布于 2023-10-15 19:21 浙江
联想
校招火热招聘中
官网直投
想问一下,二面后有后续吗?
点赞 回复
分享
发布于 2023-10-17 10:20 江苏
数仓有啥比赛
点赞 回复
分享
发布于 01-14 14:42 广东

相关推荐

Gaussdb是什么数据库Gaussdb和Doris有什么区别数据湖和数据仓库有什么区别hudi中你们用的哪种表类型hudi怎么实现实时数据更新的HIVE有哪些模块知道HIVE的thrift吗,有什么好处生产中是用哪种方式连接HIVE的,会用jdbc连接吗知道哪些spark的运行模式yarn-client和yarn-cluster的区别是什么,从中选一个运行模式具体介绍下select a,sum(b) where c>0 group by a。spark中是怎么实现的,你觉得这个语句什么情况下会出现数据倾斜,怎么优化它spark中小文件你怎么处理的我想将数据只写入到10个文件里面,怎么处理,distribute by cast(rand()*10 as bigint)怎么将a字段的值一样的数据写入到同一个文件,并最后只生成5个文件 distribute by mod(a,5)Spark中的Job、stage、task是什么关系spark的Job可以并行执行吗,stage可以并行执行吗,什么情况下stage可以并行执行,举个stage并行执行的例子Flink怎么处理积压的Flink的Exect-Once怎么实现的java的内存空间分哪些怎么让栈空间溢出,怎么让元空间溢出工作中会遇到内存溢出的问题吗内存溢出了你会怎么去分析知道哪些序列化方式,Serializable和protobufprotobuf与Serializable序列化的区别了解数据库连接池吗,是什么原理了解线程池吗,介绍下你知道的SpringBoot相对于Spring MVC的优点Spring中的注解了解哪些数据库的事务知道吗事务的隔离级别有哪些,默认是那种隔离级别你觉得你们公司目前有哪些方面可以改进的,比如工作上的改进、平台上的改进你工作中遇到了哪些难题,怎么解决的作为你的同事,你觉得你能带来什么好处你最近有去学习什么新东西吗,从中学到了什么为什么想来我司所在城市你未来的职业规划是什么#社招面经#
点赞 评论 收藏
转发
2 8 评论
分享
牛客网
牛客企业服务