大数据面试经验

#面试经验谈#
1 在介绍数仓模型时大概分下面介绍
数仓分层有哪些层,每一层的作用和构建原理,有哪些数据域和主题,对于域和主题是怎么划分的,数仓命名规范怎么定的,ads层主要是怎么设计的,数据怎么对外运用,数仓不能跨层依赖,dwd必须要有ods的所有字段,不能聚合操作,dws一般都是轻度聚合,比如用户和订单的聚合,ads通常不能直接来源dwd,只能从dim和dws来,dim层快照和非快照的区分
2 实时任务如何做到不延迟
我认为该这样答,首先确保source端消费能及时消费,要评估一下数据的QPS,然后中间计算阶段并行度要够,在规定时间需要计算完成,最后sink阶段需要及时落表,还有就是任务失败要从checkpoint拉起任务,并且消费kafka的偏移量要从最新的地方拉起,防止重复消费导致延迟,
全部评论

相关推荐

06-26 10:10
已编辑
浙江理工大学 C++
6.20 一面(1小时)1.自我介绍2-?都是c++的基础八股,不难,忘了,提一下记得的,oop三特性,多态,虚函数,动态数组,vector,插入频繁用什么,智能指针,类构造和析构顺序(抢答成员初始化顺序)?+1 合并区间,应该是简单题?+2 设计一个动态数组,包含添加插入删除元素的功能6.24 二面(18分钟???)1.介绍一下校园或者是实习经历(没自我介绍)2.看你客户端,服务端,底层都有涉及,你更倾向于什么,为什么3.说c++八股一面问过了不问,问了爬楼梯4.有个画图功能,需要加入撤销恢复功能怎么设计5.一张a4纸上有若干点,每次查询随机给出一个圆心和半径,如何快速得到所有在圆内的点,答的自底向上的分块,引导自顶向下的分治6. 一枚质地不均匀的硬币,也就是抛出正反面的概率不一样,两个人需要通过抛硬币决定谁赢,怎么设计规则比较公平啊,二面过了,等6.25三面+hr面6.25 cto+hrbp(17分钟)1. 对方自我介绍2.跟2面的2一样3. 没八股,好像是问的项目中的某个问题,一开口就停不下来巴拉巴拉然后被打断了4.刚才提到实习中有搜索相关模块如果背包中有上万种物品,如何进行快速的搜索。5. 现在是能立即到岗吗6.反问7.跟2差不多8.提到习惯为用户考虑,有没有具体的例子9.对业务了解怎么样10.期望薪资11.现在是住在xx区吗12.反问问到引擎熟悉度,坏,破绽了6.26 三面过了,等安排终面
查看38道真题和解析
点赞 评论 收藏
分享
06-26 13:51
算法工程师
人力小鱼姐:你不在当地,hr怕你只是试试水、招聘流程容易被拉长、人选容易反悔等等不可控因素 如果后续确实要到那边发展,最好简历里注明期望地点:XX(多久可到岗) 同时询问hr面试流程,有几轮,主动表明如果到了终面自己可以参加线下面试 简历集中投递,面试尽量集中安排到某1-2天,过去参加
点赞 评论 收藏
分享
评论
3
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务