京东数据开发,大数据组件二开,一面

研究生什么研究方向、为什么选择做数据
spark和mr的区别,spark为什么快
aqe的特性
spark用过的参数
shuffle.partitions调节的经验,调多大合适,是否有公式
计算和存储的治理怎么做的
spark合并小文件怎么做的,落hdfs之前合并还是之后合并?
平台自动化合并小文件和repartition哪个快(合并小文件快)
为什么要合并小文件
cbo的优化规则
对spark感兴趣吗,接受提前实习吗,最早什么时候
全部评论
有后续吗
点赞 回复 分享
发布于 2025-11-07 02:04 北京
咋样了
点赞 回复 分享
发布于 2025-10-28 12:58 马来西亚

相关推荐

我前几天面的大数据开发岗位,社招,岗位薪资是30-60k的,面试问题如下1 先自我介绍2 从你做的实时项目和离线项目重点讲一下你建设的过程和遇到的问题3 对于离线来说,你的dwd,dws,dim,ads是怎么建设的,dwd是按照什么划分的dws建设的时候需要遵循什么规范,如果一个业务在最开始做基建的时候需要怎么规划,dws如何建设可以做到后续的复用,如何体现可扩展性4 对于dqc规则一般都是配置哪些,触发了规则怎么止损,对于数据治理你怎么治理的,治理有啥量化的指标,对于一些耗时很久的任务如何进行优化5 对于实时来说我看你经验比较丰富,你平时实时主要是用哪些技术栈,对于实时一般哪些问题比较严重,你主要是做了哪些优化,优化之后提升了几倍性能,如何确保这个实时任务不延迟不出现计算问题,对于监控怎么监控的6olap的几个都聊一下,为啥需要选型这个,都各有哪些好处,为啥现在各大公司都在追求湖仓一体,对于超大的数据,一天如果有千亿起步的量级,对于数据生命周期和每个表的分区分桶和索引有啥好的方案7 对于用户画像你是怎么建设的,是如何高效的运用你建设的数仓模型,对于时效性你怎么做到的稳定可靠8 ai你们公司有用吗,ai如何进行提效的,对于一些常规的报警和一些常规的上线ai可以解决吗,怎么玩的9 你也干了几年大数据开发了,如果你作为一个领导者如何评价你们团队数仓建设的好不好,对于好的地方如何量化,不好的地方如何改进,如何平衡各个业务的模型规范10 你这边有啥问我的,我面试了2场了,给我的感觉就是人家招的是需要有实时和离线能力的人,而且是需要有快速解决问题,并且可以给团队带来技术的人,还可能要点对整体技术基建和带人的领导能力,当然薪资估计也比较高,我估计给40k起步应该问题不大的,而且我估计过了,hr频繁给我打电话呢,我还是不打算去,毕竟去年刚来这家新公司,对于需要玩大数据实时离线的可以看看我上面的问题你们都能不能会,都会估计可以去试试快手
查看9道真题和解析
点赞 评论 收藏
分享
评论
1
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务