数据分析师精选面经合集
4家公司
6篇面经
最新 热门
百度数据工程拷打
又是超过一小时的拷打,感觉这次挺综合的,八股、语言、大数据全都问了一遍1. 项目拷打,主要问我的项目为什么采用Hive Transform这种比较小众的方案,我的回答感觉他还是比较满意的2. 简述至少3种常见的排序算法,时间复杂度,稳定性3. 关系型数据库的索引的常用数据结构是?选择这种数据结构的原因是?4. MySQL中什么时候会导致索引失效?5. Java线程安全的数据结构有哪些?6. ConcurrentHashMap是怎么实现的?相比于在直接在HashMap外边加锁有什么区别?7. HashMap的key可以是什么类型?有什么要求?8. 处理金额相关的数据的时候,应该如何存储?在Java中和MySQL中应该选择什么数据类型?9. Linux下如何用一条命令统计某个目录下各个子目录的占用空间大小?10. 如果把Linux换成HDFS呢?如何统计?11. 对于一个超大的HDFS系统,会有什么性能风险?有什么优化手段?12. Spark的并发度是如何控制的?在一个任务中什么情况会导致并发度变化?13. 考虑以下场景:某电商网站有一个用户表(用户id,用户所在城市)和一个订单表(订单id,下单用户id,订单金额),请(1)统计总销售额前十的城市和这些城市对应的销售额(2)统计总销售额在10万元至20万元之间的城市14. 一个表有年、月、pv三个列,要求写行专列代码,转成年、一月、二月、三月……
查看14道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/901da1cfde83451486ef76c5f9945d2c/feed/main/detail/fcfb092e5cbe46ebbae9fc071233bb34/discuss/871506086656761856/feed/main/detail/c3166525420c44f5b1105b0dc10f0682/feed/main/detail/4d1202660675419ab5da5848b34f91d2/feed/main/detail/29ca70d84e8b4ffb8f19f86489b0d0a2
美团小象超市业务数据日常实习面经
一面和二面都是电话面试,特别突然,完全是临场反应,现在已经offer啦,hr人很好,没有因为楼主是本科生就区别对待,比我之前面其他大厂体验都要好,发面经攒人品啦一面1.自我介绍2.深挖楼主的三段实习经历,本来答得很磕磕巴巴,面试官说要用star法则讲讲,实习的背景,主要做了什么,然后还有楼主的收获3.再仔细地深入地讲了在券商里数据库维护和数据更新校验部分做了什么(估计和实习要求有挂钩)4.SQL题考察(挺简单的)(1) select语句的运行顺序(2) 窗口函数的理解,partition by的用法(3)where限制里 !=,not in,is not的区别 三者的应用场景和区别在哪5对于小象超市业务的理解(楼主最近投了太多jd,其实这部分就是随机发挥,说的是和美团买菜很像,结果歪打正着了,还有对标七鲜之类的)6.AI发展下,openclaw还有gitops等ai产品的广泛应用对于替代运营或者说帮助运营来说,会有什么影响7.现在在做的学生工作,你的实习会影响你的学生工作吗(当然说不影响啦)8.由于楼主是27届的,这段实习是日常实习,很可能没有hc,问了问楼主未来的规划,楼主有什么样的思考最后就介绍了一下小象超市实习的一些具体情况,口头说一面过了,二面会第二天打电话来继续面试,做好准备,写不下啦,手机版的牛客网写文字不太好用,所以二面见我另一篇笔记吧~希望大家都能收到满意的offer
查看10道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/7942e1ef3e10482aacfe0f7e8168d0b7/feed/main/detail/e08c0af1018d412689f98f90cd6267e0/feed/main/detail/021e54e4c7014679b9208b61cbf92b45/feed/main/detail/80d232cffdfd47059c3ed5a1794bf0c2/discuss/868507043638886400/feed/main/detail/54fdc244aa344636910b4ade0256c32f
快手大数据开发
我前几天面的大数据开发岗位,社招,岗位薪资是30-60k的,面试问题如下1 先自我介绍2 从你做的实时项目和离线项目重点讲一下你建设的过程和遇到的问题3 对于离线来说,你的dwd,dws,dim,ads是怎么建设的,dwd是按照什么划分的dws建设的时候需要遵循什么规范,如果一个业务在最开始做基建的时候需要怎么规划,dws如何建设可以做到后续的复用,如何体现可扩展性4 对于dqc规则一般都是配置哪些,触发了规则怎么止损,对于数据治理你怎么治理的,治理有啥量化的指标,对于一些耗时很久的任务如何进行优化5 对于实时来说我看你经验比较丰富,你平时实时主要是用哪些技术栈,对于实时一般哪些问题比较严重,你主要是做了哪些优化,优化之后提升了几倍性能,如何确保这个实时任务不延迟不出现计算问题,对于监控怎么监控的6olap的几个都聊一下,为啥需要选型这个,都各有哪些好处,为啥现在各大公司都在追求湖仓一体,对于超大的数据,一天如果有千亿起步的量级,对于数据生命周期和每个表的分区分桶和索引有啥好的方案7 对于用户画像你是怎么建设的,是如何高效的运用你建设的数仓模型,对于时效性你怎么做到的稳定可靠8 ai你们公司有用吗,ai如何进行提效的,对于一些常规的报警和一些常规的上线ai可以解决吗,怎么玩的9 你也干了几年大数据开发了,如果你作为一个领导者如何评价你们团队数仓建设的好不好,对于好的地方如何量化,不好的地方如何改进,如何平衡各个业务的模型规范10 你这边有啥问我的,我面试了2场了,给我的感觉就是人家招的是需要有实时和离线能力的人,而且是需要有快速解决问题,并且可以给团队带来技术的人,还可能要点对整体技术基建和带人的领导能力,当然薪资估计也比较高,我估计给40k起步应该问题不大的,而且我估计过了,hr频繁给我打电话呢,我还是不打算去,毕竟去年刚来这家新公司,对于需要玩大数据实时离线的可以看看我上面的问题你们都能不能会,都会估计可以去试试快手
查看9道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/42b85be257ec4517aec88a99eb4b2acc
腾讯 数据工程一面
查看13道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/5874f6faaf3840feafca3f274fe65445/feed/main/detail/8e6fa7bd74894569b80283579a013e22
04-02 13:34
已编辑
Columbia University 数据分析师
途游数据分析面经
查看3道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/8e1f8ce6c39546bfb6126ace65d1e408/discuss/865622882972356608/feed/main/detail/c2ce21535a5b449697713e029ee0883f/feed/main/detail/b2ee48e237a64d8aa98f44d8bd671050/feed/main/detail/e3a63194e34e42f5b9b76194fcdf5939
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务