首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
万树
McMaster University C++
发布于江苏
关注
已关注
取消关注
@三石大数据:
最新字节一面面经及答案【大厂面经系列】
推荐阅读文章列表大数据开发面经汇总【持续更新...】我的大数据学习之路大数据开发面试笔记V6.0面经及答案1.有没有做过一些SQL优化,用过布隆过滤器吗 *我们要明白为什么要做SQL优化?当然时因为任务跑的慢,那么哪些算子跑的慢呢?最常见的包括 join、group by、count(distinct)、row_number等等接下来就一一讲一下针对每一种算子有哪些优化的方法论(这里主要说一下count distinct)第一种最常见的方法就是两阶段聚合,即使用两层group by(这时候选取key非常重要,可能会因为选取的key倾斜导致代码执行并没有变快)第二种就是布隆过滤器(bitmap的扩展),详细描述见此文 BitMap在数仓领域的应用2.谈谈你对数据仓库的理解 *定义:数据仓库是一个面向主题的(司机、乘客、订单)、集成的(来自不同数据源的统一数据规范比如男女的取值,命名规范的统一,字段类型的统一)、非易失(一般不会进行删除和修改操作)且随时间变化(并不是数据会变,而是数据随着时间会不断增多)的数据集合作用:主要用于存储历史数据,然后通过分析整理进而提供数据支持和辅助决策。3.为什么要对数仓进行分层第一个是将复杂的需求简单化;我们通过将复杂的问题分解为多个步骤来完成,每一层只处理单一的步骤,比较容易和理解第二个是提高数据的复用性;比如在已经得到最终结果之后,又需要中间层的一些数据,我可以直接查询中间层的数据,不必重新进行计算4.group by和窗口函数的区别窗口函数保留原始数据,会将分组聚合后的结果拼接在原始数据上,最终返回的行数与原始据行数相等。而group by只能得到分组聚合后的数据,最终返回的行数和分组数目相等。窗口函数能够限制对每一组的部分数据进行处理(指定开窗范围),而group by只能对每一组的所有数据进行处理。5.你知道spark的作业执行流程吗 *当一个 Spark 应用被提交时,首先需要为这个应用构建基本的运行环境,即由Driver创建一个SparkContext对象,SparkContext 会向资源管理器注册并申请运行Executor的资源,SparkContext可以看成是应用程序连接集群的通道。资源管理器为Executor分配资源,并启动Executor进程,Executor运行情况将随着心跳发送到资源管理器上。SparkContext根据RDD的依赖关系构建DAG图,并将DAG图提交给 DAG 调度器(DAGScheduler)进行解析,将 DAG 图分解成多个阶段(每个阶段都是一个任务集),并且计算出各个阶段之间的依赖关系,然后把一个个任务集提交到底层的任务调度器(TaskScheduler)进行处理;Executor 向 SparkContext 申请任务,任务调度器将任务分发给 Executor 运行,同时,SparkContext 将应用程序代码发放给 Executor。任务在 Executor 上运行,把执行结果反馈给任务调度器,然后反馈给 DAG 调度器,运行完毕后写入数据并释放所有资源。6.Spark的内存区域是怎么划分的Spark分为堆内内存和堆外内存,堆内内存由JVM统一管理,而堆外内存直接向操作系统进行内存的申请,不受JVM控制堆内内存又分为存储内存、执行内存**(前两种统称为统一内存)、其他内存(前三种统称为可用内存)**和预留内存,存储内存主要存放广播变量和缓存变量,执行内存主要存放shuffle过程的数据,其他内存主要存放RDD的元数据信息,预留内存和其他内存作用相同;预留内存一般为300M,统一内存占比60%,其中存储内存和执行内存的占比时动态变化的堆外内存:减少了垃圾回收的工作,因为垃圾会收会暂停其他的工作7.听说过双亲委派模型吗如果一个类加载器收到了类加载的请求,它首先不会尝试加载整个类,而是把这个请求委派给上一层类加载器去完成,每一层的类加载器都是如此,因此最终会传送到最顶层的启动类加载器上。它会尝试加载这个类,只有当它无法完成这个加载请求时,下一层的类加载器才会去尝试加载,如果所有的类加载器都无法加载,就会抛出ClassNotFoundException8.JVM的垃圾回收算法有哪些 *标记-清除算法:分为标记和清除两个阶段,标记是标记出所有需要回收的对象(也可以反过来,标记出所有存活的对象),标记的时候是基于可达性分析算法实现的;清除就是标记后对所有未被标记的对象进行回收标记-复制算法:复制就是将可用内存按容量分为大小相等的两块,每次只使用其中一块,当这一块的内存用完了,就将还存活的对象复制到另一块内存上,然后再把已使用过的内存空间一次清理掉标记-整理算法:整理就是根据存活对象进行整理,让存活对象都向一端移动,然后直接清除边界以外的内存9.介绍一下JVM的内存结构程序计数器:记录当前线程执行的字节码指令的地址虚拟机栈:在执行方法的时候,JVM会同步创建一个栈帧,用于存储局部变量表、操作数栈、方法出口等信息,如果方法执行完毕,就会将该栈帧从虚拟机栈中出栈本地方法栈:和虚拟栈原理基本一样,区别是为native方法服务的堆:用来存放创建的对象元空间:用来存储被加载的类信息、常量、静态变量以及常量池等数据10.Spark3.0新特性AQE有了解过吗 *AQE又叫自适应查询执行(Adaptive Query Execution),解决了最初生成的查询计划不是最优的问题,在Spark查询过程中不断收集统计数据,然后通过算法模型来优化执行计划。AQE主要由三个核心功能:动态合并Shuffle分区、动态切换Join策略、动态优化数据倾斜
点赞 16
评论 0
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
10-08 21:39
网易_数据开发工程师
26 27届数据类实习/校招出现的乱象
前言当前26届秋招已过了一半,盘点一下带过百位26届实习/校招出现过的一些情况,也能给27届或还在26届找工作的同学起到一些帮助。现象1-各公司越来越卷学历卷学历现象从最近2年来看都是普遍现象,数据开发侧可能还好,基本双非本硕以上同学都能有面试机会,但26届对于双非本科同学就没有那么友好了,需要多段大厂实习进行支撑(建议提前准备考研、或提前准备实习),即使双非本硕作为门槛,仍然有大量985、211同学在竞争,对于数分侧来说更不友好,985硕属于标配,还需要加之前大厂经历才能有面试机会,可能数开侧同学在28届29届学历要求标准还会继续有所变动,相对来说更卷一些。同时对于一些学历厂例如阿里云等更看...
如何一边实习一边秋招
点赞
评论
收藏
分享
10-08 15:33
滴滴_移动端研发工程师(准入职员工)
滴滴内推,滴滴内推码
一、吃 食堂三餐齐全,晚餐有30元补贴,还可以点“食域”外卖(送到楼层茶水间)。商家每周轮换,种类丰富但有限(快餐、轻食、粉面等)。二、办公设备1. 入职即配笔记本电脑,技术岗Mac,非技术岗联想。2. 工位自带显示器,即插即用。3. 免费领取鼠标、转接器等,内部系统还可申请文具和生活用品。三、福利1. 餐补:食堂或外卖任选,晚餐免费。2. 班车:早晚免费接送,西二旗地铁站直达。3. 积分商城:参与活动攒积分,可兑换生活用品。4. 健身房:设备基础,错峰使用人少,淋浴设施齐全。 5. 休息室:午休床位少,需抢。6. 节假日福利:妇女节、跨年盯盘有小礼品。7. 活动:食堂限时特色餐、内部抽奖等。...
滴滴公司福利 1613人发布
点赞
评论
收藏
分享
09-05 13:48
六盘水师范学院 化学分析
主打一个听劝
牛客48826091...:
哥们胸肌挺好看
点赞
评论
收藏
分享
08-21 17:27
武汉理工大学 golang
谁说读研不如本科直接工作的,黑子说话!
牛客40297450...:
不是研究生强,是你强
点赞
评论
收藏
分享
10-09 21:01
门头沟学院 前端工程师
作业帮前端一面
自我介绍怎么进行学习介绍项目遇到的难点怎么解决的不用echarts怎么实现图表流式数据输出css实现动画的方式水平垂直居中localstorage和sessionstorage区别在浏览器输入url到页面渲染出来的过程重绘重排的概念与区别CSS 中哪些属性会触发 GPU 加速???(好像是这个问题)js的异步加载怎么做、执行顺序以及区别事件循环常见的宏任务微任务有哪些常见的导致内存泄漏的场景浏览器的回收机制强缓存和协商缓存以及各自的属性有哪些http1.0和2.0区别elementui按需加载怎么实现的vue组件间通信vue响应式功能怎么实现的,怎么做到的监听vue的生命周期以及各个生命周期做...
查看27道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
JVM调优
1.1W
2
...
双非秋招记录(下)
4018
3
...
前端面试,八股怎么准备?(附速通版)
3705
4
...
国庆有感 测开劝退
3077
5
...
就这样上班一年了,选对公司跟选对人是一样的。。
3041
6
...
分享一个很友好的公司
3041
7
...
华为OD备考建议—算法篇
2040
8
...
10.9 荣耀通软一面
2033
9
...
实习生放了八天假
1733
10
...
测开这条路很伟大 又拿下一家
1630
创作者周榜
更多
正在热议
更多
#
国庆后,我的返工状态
#
8843次浏览
43人参与
#
求职你最看重什么?
#
96362次浏览
558人参与
#
爱玛科技集团求职进展汇总
#
5947次浏览
89人参与
#
一觉醒来,穿越回国庆前
#
16931次浏览
74人参与
#
非技术岗简历怎么写
#
246748次浏览
3045人参与
#
找工作有哪些冷知识
#
152771次浏览
2404人参与
#
深信服秋招来了
#
276355次浏览
2908人参与
#
薪资爆料
#
162162次浏览
1352人参与
#
秋招OC许愿
#
363679次浏览
2596人参与
#
今年秋招还有金九银十吗
#
9096次浏览
51人参与
#
春招你拿到offer了吗
#
734073次浏览
9693人参与
#
机械/汽车制造公司岗位评价
#
13717次浏览
100人参与
#
央国企投递记录
#
115679次浏览
1480人参与
#
锐捷网络求职进展汇总
#
4972次浏览
24人参与
#
腾讯音乐求职进展汇总
#
129210次浏览
968人参与
#
美团秋招笔试
#
165016次浏览
958人参与
#
工作经验重要还是工资重要?
#
143613次浏览
1093人参与
#
26届秋招投递记录
#
37207次浏览
429人参与
#
生活已被工作填满,要不要辞职?
#
17964次浏览
101人参与
#
你收到了团子的OC了吗
#
1429201次浏览
11786人参与
#
运营每日一题
#
101641次浏览
851人参与
#
面试吐槽bot
#
139866次浏览
749人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务