社招-数据仓库工程师面经

开篇想说一下自我介绍的问题。这个问题我的应对策略是:
1. 简要介绍何时毕业于哪所学校(姓名,籍贯可选择)
2. 从近往远介绍开始介绍工作经验
3. 大厂大项目靠前介绍,其他情况靠后
4. 小项目简要介绍一两句话概括
5. 重要介绍和自己面试岗位匹配的项目,需要调理分明

后续就是按照你上面介绍的项目具体询问各种细节问题,下面罗列一下自己遇到的相关面试问题:

一、某团面试问题

范式建模/维度建模的区别,应用场景的区别,优缺点
sql 分组三类函数的区别
拉链表的实现
数据分层情况/原因,解决的什么问题
数据抽取和同步的方法
join的表中筛选和where中筛选有什么区别
手写计算器java实现
手写快排
手写sql,随意修改要求说出统计思路
linux过滤命令 grep -A / -B 去固定行的上下几行
hive整个调优过程做了哪些
hive数仓整体架构,实现过程,有哪些问题,是怎样解决的
元数据是怎样管理的?元数据中都包括了那些数据
mapreduce 执行原理
hive的窗口函数

二、某汽车行业大厂

Hive 和MySQL的区别
元数据是怎么应用的
元数据,技术元数据和业务元数据都包含了哪些?
分区和分桶具体怎么实现的?
调度框架的运行机制和原理
数据仓库整体架构
元数据怎样管理
怎样保证数据质量
监控都做了哪些
Hive 支持的底层数据文件类型有哪些
IBM范式建模的七大主题是什么?其中怎样理解当事人主题
数据仓库的容量,日增数据量
怎样实现历史拉链
Sql优化都做了哪些?
关系型数据库到hive 效率提升的拐点是什么?就是多大数据量后关系型数据库计算效率不如hive

三、其他(上面重复的不在赘述)

数据表的分组和分块? 
为什么要用Hbase 而不用关系型数据库?
简要介绍一下mapreduce执行时的数据流转

四、一定会被问的问题(表现不错的话)

从上家公司离职的原因
职业规划
你对面试官还有什么想问的吗?

虽然都说大环境不好,但是工作机会还是有,需要多做准备,还是可以找到心仪的工作的!
#社招##面经##数据库工程师#
全部评论
能透漏一下大概薪水吗 嘻嘻
点赞 回复
分享
发布于 2020-02-02 17:39
联想
校招火热招聘中
官网直投
想问一下sql 分组三类函数,只知道,group by还有开窗函数这两类,不知道第三类是?
点赞 回复
分享
发布于 2020-03-19 15:09

相关推荐

Gaussdb是什么数据库Gaussdb和Doris有什么区别数据湖和数据仓库有什么区别hudi中你们用的哪种表类型hudi怎么实现实时数据更新的HIVE有哪些模块知道HIVE的thrift吗,有什么好处生产中是用哪种方式连接HIVE的,会用jdbc连接吗知道哪些spark的运行模式yarn-client和yarn-cluster的区别是什么,从中选一个运行模式具体介绍下select a,sum(b) where c>0 group by a。spark中是怎么实现的,你觉得这个语句什么情况下会出现数据倾斜,怎么优化它spark中小文件你怎么处理的我想将数据只写入到10个文件里面,怎么处理,distribute by cast(rand()*10 as bigint)怎么将a字段的值一样的数据写入到同一个文件,并最后只生成5个文件 distribute by mod(a,5)Spark中的Job、stage、task是什么关系spark的Job可以并行执行吗,stage可以并行执行吗,什么情况下stage可以并行执行,举个stage并行执行的例子Flink怎么处理积压的Flink的Exect-Once怎么实现的java的内存空间分哪些怎么让栈空间溢出,怎么让元空间溢出工作中会遇到内存溢出的问题吗内存溢出了你会怎么去分析知道哪些序列化方式,Serializable和protobufprotobuf与Serializable序列化的区别了解数据库连接池吗,是什么原理了解线程池吗,介绍下你知道的SpringBoot相对于Spring MVC的优点Spring中的注解了解哪些数据库的事务知道吗事务的隔离级别有哪些,默认是那种隔离级别你觉得你们公司目前有哪些方面可以改进的,比如工作上的改进、平台上的改进你工作中遇到了哪些难题,怎么解决的作为你的同事,你觉得你能带来什么好处你最近有去学习什么新东西吗,从中学到了什么为什么想来我司所在城市你未来的职业规划是什么#社招面经#
点赞 评论 收藏
转发
5 87 评论
分享
牛客网
牛客企业服务