社招-数据仓库工程师面经

开篇想说一下自我介绍的问题。这个问题我的应对策略是:
1. 简要介绍何时毕业于哪所学校(姓名,籍贯可选择)
2. 从近往远介绍开始介绍工作经验
3. 大厂大项目靠前介绍,其他情况靠后
4. 小项目简要介绍一两句话概括
5. 重要介绍和自己面试岗位匹配的项目,需要调理分明

后续就是按照你上面介绍的项目具体询问各种细节问题,下面罗列一下自己遇到的相关面试问题:

一、某团面试问题

范式建模/维度建模的区别,应用场景的区别,优缺点
sql 分组三类函数的区别
拉链表的实现
数据分层情况/原因,解决的什么问题
数据抽取和同步的方法
join的表中筛选和where中筛选有什么区别
手写计算器java实现
手写快排
手写sql,随意修改要求说出统计思路
linux过滤命令 grep -A / -B 去固定行的上下几行
hive整个调优过程做了哪些
hive数仓整体架构,实现过程,有哪些问题,是怎样解决的
元数据是怎样管理的?元数据中都包括了那些数据
mapreduce 执行原理
hive的窗口函数

二、某汽车行业大厂

Hive 和MySQL的区别
元数据是怎么应用的
元数据,技术元数据和业务元数据都包含了哪些?
分区和分桶具体怎么实现的?
调度框架的运行机制和原理
数据仓库整体架构
元数据怎样管理
怎样保证数据质量
监控都做了哪些
Hive 支持的底层数据文件类型有哪些
IBM范式建模的七大主题是什么?其中怎样理解当事人主题
数据仓库的容量,日增数据量
怎样实现历史拉链
Sql优化都做了哪些?
关系型数据库到hive 效率提升的拐点是什么?就是多大数据量后关系型数据库计算效率不如hive

三、其他(上面重复的不在赘述)

数据表的分组和分块? 
为什么要用Hbase 而不用关系型数据库?
简要介绍一下mapreduce执行时的数据流转

四、一定会被问的问题(表现不错的话)

从上家公司离职的原因
职业规划
你对面试官还有什么想问的吗?

虽然都说大环境不好,但是工作机会还是有,需要多做准备,还是可以找到心仪的工作的!
#社招##面经##数据库工程师#
全部评论
能透漏一下大概薪水吗 嘻嘻
点赞 回复
分享
发布于 2020-02-02 17:39
博乐游戏
校招火热招聘中
官网直投
想问一下sql 分组三类函数,只知道,group by还有开窗函数这两类,不知道第三类是?
点赞 回复
分享
发布于 2020-03-19 15:09

相关推荐

- 美团:到店事业群--平台技术部(暑期实习一面)- 上来面试官说看你简历挺匹配的,I'm like whaaaaat- 自我介绍- 为什么去读研了- 你们团队多少人- 你们数仓怎么分层- 你主要负责哪几层- ODS 数据从哪来,怎么接入数仓- ODS 表是什么事实表类型?更新方式?- ODS 到 DWD 做了哪些处理?- DWD 有哪些表,事实表如何设计的?- 你提到了数据字典,解释一下- 通过什么实现的(数据资产管理的平台)- 数据库 vs 数据仓库- 数据库为什么要减少冗余(数据更新导致数据不一致)- 数据仓库有冗余,如何保证一致性(我讲的更多需要人为的干预+平台功能)- 数仓分层的意义- Spark 的 stage 是如何划分的- 哪些算子会出现 Shuffle- 小文件优化,小文件是怎么产生的- Map 端造成的小文件问题怎么处理- 表存储优化:小文件治理、生命周期治理、下线无用表- 生命周期治理是每一层生命周期不同吗,考虑哪些方面- 分桶表的场景- MySQL 的索引一般是用什么数据结构- 介绍 B+ 树- 索引匹配原则- 写一个 SQL:[SQL270 考试分数(五)](https://www.nowcoder.com/practice/b626ff9e2ad04789954c2132c74c0513?tpId=82&tqId=35496&ru=/exam/oj)- 反问:部门业务?美团数仓建设?公司平台建设情况?- 感觉面试官明显对数仓建设、数据治理、数据一致性之类问题更感兴趣,Hive、Spark 之类的框架八股基本没问,算法题更是都没出,只出了一道中位数的 SQL(然后我写的 SparkSQL 牛客网还跑不了,面试官 be like 没事,差不多就行了 -_-||)- 心路历程:第一次面试有点紧张,虽然问题都非常简单,但我很多地方表达的不是很顺畅,有几个问题一开始都没 get 到面试官的点,感觉情况不太乐观。面试官很好,奈何我不够给力,哈哈。许愿二面 😥-------------------------------------------Update:3.25 刚刚收到电话约了二面Update:字数不够了,二面面经在动态
点赞 评论 收藏
转发
阿里云算法实习生持续招聘中!!!LLM大模型方向!!!欢迎投递私聊!【团队介绍】   阿里云智能弹性计算是阿里云飞天平台(阿里云自研云计算操作系统)的核心,在全球有超过200个数据中心,19个地域,为全球数10亿用户提供着可靠的计算服务。   我们管理着海量物理机和虚拟机,提供超大规模服务编排能力,专注于大数据之上的机器学习算法研究与应用,如果你了解机器学习、深度学习、强化学习、迁移学习、主动学习、特征提取与稀疏学习、等级学习等相关知识,对人工智能抱有极大的热情,勇于挑战各种实际应用难题,欢迎加入我们:阿里云弹性计算--库存调度--智能引擎团队!  【岗位要求】   1、本科及以上学历,硕士博士优先,计算机、数学、电子工程、通信、信息系统、大数据、统计学等相关专业;   2、熟悉常用机器学习算法,对模式识别、深度学习、增强学习等相关领域,掌握C/C++、Java、Python等至少一门编程语言;   3、候选人有数理分析方面良好的素养以及数理统计基础;   4、有实际成果并发表在国际顶级会议、期刊者优先,有在KDDCUP、ImageNet、MSCOCO、ICDAR等权威比赛中取得优异成绩者优先。   5、有deeplearning的经验,大规模数据处理经验优先。   【招聘对象】  2026届毕业的海内外 本硕博学生  实习地点:北京、杭州   【简历投递】   邮件标题:姓名-学校-期望实习城市   邮件内容:简单介绍一下自己的优势即可   附件:个人简历 投递邮箱:**********岗位链接:https://www.nowcoder.com/jobs/detail/310377?jobId=310377https://www.nowcoder.com/jobs/detail/172543?jobId=172543
投递阿里云等公司10个岗位
点赞 评论 收藏
转发
5 87 评论
分享
牛客网
牛客企业服务