数据分析师精选面经合集 - 校招实习社招 - 牛客网

数据分析师精选面经合集

4家公司

6篇面经

最新热门

昨天 16:29

已编辑

门头沟学院数据仓库

名创优品数据平台工程师面经

1.自我介绍2.拷打实习，广播变量的原理3.做了哪些看板指标4.数仓的ads层都是hive表吗5.帆软BI做过哪些看板6.拷打项目，拉链表怎么设计的7.为什么出现零点漂移8.个人优势与劣势9.公司能为我带来什么10.实习和上课的权衡11.ai有用过吗总结:几乎没有八股，一直在拷打实习和项目，关注点更多是报表制作以及数据抽取

查看11道真题和解析

点赞评论收藏

分享

昨天 14:19

已编辑

门头沟学院数据仓库

实在智能数据开发春招面试（当场通过）

这场面试整体体验很完美，面试官很好，后面大量的时间在介绍公司和成长规划，最后也是如愿以偿的过了1.自我介绍2.开发语言擅长哪一种，我回答的python2.python中列表和元组的区别3.你经常用python哪个库4.pandas对数据分块的方法5.场景：用pandas独立开发一个异常重置的功能块，你会怎么设计6.数据库查询返回速度较慢，你会怎么优化（常见八股）7.用过哪些bi工具，主要涉及哪些业务模块8.一些实习项目的拷打，数据倾斜之类的面试官介绍公司业务和我需要做的，体验真的蛮好，我有些疑问都耐心解决了，最后也通过了，春招迄今为止收到offer最想去的公司

查看9道真题和解析

点赞评论收藏

分享

03-07 14:15

北京理工大学 Java

京东数据开发一二面

一面 1.@Autowired 和 @Resource 的区别2.map遍历删除的一个代码题3.Redis缓存击穿、缓存穿透、缓存雪崩4.springboot启动流程5.自动装配5.项目二面开始问完全和后端无关的1.项目2.反问

点赞评论收藏

分享

03-06 15:36

武汉工程大学大数据开发工程师

飞未云科数开实习面经

1.项目相关2.项目数据量多大3.数据清洗用的是hive还是spark4.小文件合并，数据倾斜5.ai运用能力，是否能分辨正确性6.hive sql（更新查询计算相关）7.是否熟悉python8.什么时候到岗，能工作多久9.反问第一次面试，感觉有点紧张，数据倾斜那一块说的时间太长了，面试官很友好

查看8道真题和解析

点赞评论收藏

分享

03-06 12:24

门头沟学院 Java

多益网络大数据研发工程师技术面

昨天刚面试的，面试官很好，没看到网上有2026多益的大数据工程师面试，所以说分享一下（首先本人网上关于多益的讨论我也知道，至于为什么选择多益，主要是其他公司没有回应，多益完全是走一步看一步，能进就进）1：自我介绍2：你实习做的是软件测试，为什么会应聘大数据开发？3：本科阶段大数据主要学习了什么大数据生态？有什么项目经验吗？4：刚刚说到你有三个月软件测试实习经验，，你有什么心得或者你学到了什么？5：你最了解的是java语言，那就从java开始吧，java中你最熟悉的集合是什么？6：你刚刚说到了ArrayList，那么他的底层是什么？用在什么场景？7：还有一种集合叫LinkedList，他的底层是什么，使用场景又是什么？8：LinkedList和ArrayList相比在查找元素方面那个更快？9：java中锁有几种实现方式？10：如果有一个字符串String name = "名字”，里面有几个对象？存放在哪里？11：你刚刚说到了堆对吧，那么栈是用来干什么的？12：java中还有其他内存结构吗？13：过往程序出现过内存溢出的情况吗？14：MySQL存储引擎有那些？15：InnoDB的索引有什么用？16：InnoDB是怎么实现的？17：为什么要用B+树？能不能用B树？18：MySQL是行存储还是列存储？19：行和列存储有什么区别？20：MySQL的主键和唯一索引的区别？21：你知道的MySQL表连接有那些？22：假如A表有123，B表有124,他们用RDD连接，然后要查出他们的差异用什么实现？23：你主要使用的hadoop版本是什么呢？24：hadoop的HDFS有那些角色构成？25：NameNode和DataNode分工是什么？26：在HDFS上创建海量小文件，会给HDFS带来什么问题？27：Hive数仓搭建过吗？用的什么模型？28：星型模型的特点是什么？29：SORT BY和ORDER BY的区别30：Hive内部表和外部表的区别31：代码题：给定一段英文字符串，你需要找出其中出现频率最高的单词。如果多个单词出现频率相同，则以字典序依次输出。忽略大小写和标点符号。33：你手上有其他offer吗？能透露薪资吗？34：你期望工资是什么？后续就是一下疑惑解答1：公司有加班情况吗？有工资吗？ 答：有加班，加班主要是学习为主2：公司有出差吗？ 答：没有，后续可能会有浙江那边的出差需求基本上就这些，代码题要求先说思路然后写代码，只有5分钟（可能前面问答浪费太多时间了，代码没写完就没时间了）主要就是围绕项目的技术进行提问，然后根据上一个问题带出新的问题。有什么想问的可以评论区交流！希望能过

点赞评论收藏

分享

03-05 21:41

中国地质大学（武汉）数据仓库

字节数开一二面

上周面的 一面：1.实习经历，业务理解，sla怎么保障？埋点分区字段，2.spark 参数调优3.sql题，排序的窗口函数，求每个班级分数的前10%人面的很糟糕，脑子一片空白二面：2. 实习的业务理解，整个需求生命周期，关注哪些指标？3. 数仓分层，范式建模/纬度建模，三范式4.  维度建模过程5.    维度表/事实表区别6.    星形模型/雪花模型区别7.   数据倾斜定位/解决方式8.   hivesql转mr任务过程9.   spark 底层join方式哪些？10.   order by/sorted by11. distribute by /partition by区别12  进程、线程区别13  sql  字符串分割+爆炸函数+合并14  ai 的理解常规八股，感觉是bg+实习不能让面试官眼前一亮 遂挂

点赞评论收藏

分享

03-03 16:57

已编辑

门头沟学院数据仓库

观远数据数仓一面(已过)

(昨天忘记录了，有些忘记了)比较常规的八股1.自我介绍2.数仓实习中主要在哪几个数仓分层中参与过工作3.数仓中etl的工作简单说一下4.窗口函数中三种排序的区别5.SQL中排序函数有哪些6.用过哪些bi，有没有从零搭建起bi报表7.数仓中数据校验怎么校准，排查的时候有什么流程8.实习中业务问题，实习中遇到哪些比较困难的事情9.数仓分层有哪些，分层有什么作用大概是这些，有点记不清了反问:入职后主要涉及业务——餐饮业务我的表现怎么样——技术深度超过大多数人，业务沟通能力欠缺，我们需要更多的和客户接触面试后问了HR，没有明确表示拒绝，一周内出结果

查看9道真题和解析

点赞评论收藏

分享

03-02 17:46

已编辑

西安电子科技大学 Java

小红书数据库平台开发二面面经

1. 实现最长严格递增子序列的长度（要求阐述思路、编写代码并说明时间复杂度）2. 用递归方式实现将二叉树左节点值放到右边并连接到根节点右节点（编写代码）3. TCP和UDP最主要的区别是什么？4. TCP的拥塞控制是为了解决什么问题？5. 操作系统中进程和线程的区别和联系是什么？6. 串行程序改并行，多进程相比于多线程有什么优势？7. 代码调用中，同步调用和异步调用分别指的是什么？8. 异步调用中，调用方怎么拿到执行结果？有哪些方式？9. 平时用的最多的AI编程工具是什么？10. 用AI辅助编程过程中，有哪些发挥AI编码能力的经验？11. 编写提示词时，有针对大模型幻觉做过哪些处理？12. 是否试用过Open Cloud？13. 使用的Open Cloud基于哪家大模型？14. 用Open Cloud主要用来做什么？15. Open Cloud是安装在自己电脑还是服务器上？16. 是否了解Go、Python、前端相关技术？掌握程度如何？17~20 问项目20. 自己开发的项目中遇到过哪些比较奇怪的问题？如何解决的？21. 如果发offer，大概什么时候可以入职？22. 面试者有什么想要向面试官提问的？Timeline：0213一面，0226二面

查看19道真题和解析

点赞评论收藏

分享

02-09 15:59

四川农业大学 Java

腾讯数据工程一面面经

上来三道算法题1.给你两个字符串S1和S2，写一个函数来判断S2是否包含S1的排列，如果是则返回True，如果否则返回False。换句话            说，S1的排列之一是S2的子串（滑动窗口）2.给定一个数组，它的第i个元素是一只绑定股票的第i天的价格，如果你每天只允许完成一笔交易，设计一个算法来计算        你获得最大利润（很简单）3.给你一个整数数组nums，判断是否存在三元组嗯nums i nums j nums k满足i不等于j，i不等于k，j不等于k，同时要        满足nums i nums j nums k相加加等于0，请返回所有和为0且不重复的三元组（先排序，然后）项目拷打1.讲一下你对这个项目中学到的一些东西或者是感触比较深的一些事情吧2.你处理数据倾斜，你说有个Map Join是吧？你讲一下这个它执行过程3.小表一般多大的时候可以用MapJoin？4.Spark的计算中血缘关系有有什么作用5.Spark Streaming有了解过吗？总结，算法写了快1个半小时，后面的八股也写的不怎么样😪

查看8道真题和解析

点赞评论收藏

分享

02-11 15:27

已编辑

门头沟学院数据仓库

某AI初创公司数分一面

1.自我介绍2.介绍一下你在第一段第二段实习做的内容3.介绍一下你在实习中写过最复杂的一段SQL代码，什么样的背景4.你的优缺点5.你的数据敏感度体现在工作中哪里6.SQL和Python熟练程度给你自己打几分7.介绍一下你在第二段实习中的大模型一提效项目8.在这个过程中怎么消除幻觉9.大模型分类准确率为什么只有百分之七十，因为什么问题10.你在这个过程中遇到什么困难反问:1.什么业务——运营商数据2.什么技术栈——hive和Python3.四月底可以转正

查看10道真题和解析

点赞评论收藏

分享

03-02 17:45

已编辑

西安电子科技大学 Java

小红书数据库平台开发一面面经

1~6 项目+实习7. Redis实现分布式锁的底层做法是什么？8. Redisson对分布式锁的封装，除了命令和过期时间，还有哪些额外机制？9. 什么场景下需要在Redis中使用Lua脚本？10. Redis执行Lua脚本会中途失败吗？失败后有什么处理措施？11. 你开发中Redis用的单节点还是主从？主从故障是怎么切换部署的？12. Redis哨兵的选主流程是怎样的？13. Redis主从切换期间，代码里怎么处理连接不上的情况？14. 若要设计优化Redis主从切换的代码，缓存/分布式锁场景分别怎么做？15. 你当前的Redis实现中，主节点故障连不上会有什么影响？16. 抛异常后上层调用会持续尝试获取锁吗？怎么避免下游影响上游？17. 程序无法判断Redis是短暂/长时间故障时，怎么保证快速恢复且避免频繁重连？18. MySQL中索引失效的场景有哪些？19. 是不是只要用like语法，索引就会失效？20. 总结下MySQL索引失效的根本原因是什么？21. 现场编写单向链表删除倒数第N个节点的代码（需先讲思路）22. 毕业时间、是否能处理学校事务、年后能否实习、预期实习时长？23. 你对面试官的反问：岗位业务/面试流程/自身可提升点？发下面经积攒好运

点赞评论收藏

分享

02-09 10:42

门头沟学院大数据开发工程师

蚂蚁面试SQL—分层贪心招聘问题

题目描述某互联网大厂在进行员工招聘，给定固定的薪资预算【12万】，公司制定了如下贪心招聘策略：优先招聘 高职级员工（P7>P6>P5）在同一职级内，优先招聘期望薪资更低的候选人在满足高职级招聘人数尽可能多的前提下，再考虑低职级总招聘薪资不能超过预算数据模拟 CREATE TABLE dwd_emp_candidate_di ( candidate_id VARCHAR(20) COMMENT '候选者ID', level VARCHAR(20) COMMENT '应聘职级', salary DOUBLE COMMENT '预期薪资（单位：万）' ); INSERT INTO dwd...

查看1道真题和解析

点赞评论收藏

分享

02-08 22:55

门头沟学院大数据开发工程师

高德数据开发

前2天面试了高德，面试问题如下1 先自我介绍2 挑一个你做的很好的项目描述一下，突出其中的技术点和难度3 对于实时数仓你这边的技术选型，为啥需要选这一套，优缺点是啥4 对于目前的湖仓你这边是怎么用的，比如对于一条日志流数据，后续有很多下游，既要实时和离线，你会怎么考虑接近这个日志数据5 对于olap引擎索引一般都是怎么用的，你平时用的话有什么考虑，对于索引有啥要求吗6 对于数据治理你这边怎么看，数据治理主要优先考虑哪几个方面，收益怎么体现7 对于一个新的业务你来设计一套数据基建主要从哪方面入手，如何考虑后续的高扩展性8 你平时用ai吗ai主要是用在哪些方面，对于ai能起到提效的作用吗9 有啥需要找我了解吗

查看8道真题和解析

点赞评论收藏

分享

02-08 20:19

门头沟学院 Java

Tcl 数据分析

1.你是哪里人，来这方便吗？（稳定性提问）2.你为什么选择人力方向？对哪个模块兴趣大？3.既然不从事本专业的方向，那么为什么会选择这个专业。4.在职期间你涉及到的招聘岗位都有哪些？5.你涉及到的招聘渠道和招聘网站有哪些？6.你的数据分析能力怎么样？举例子说明下7.你队于实习地点是怎么考虑的？8.你对于TCL的了解有多少？9.你希望在这段实习中学到什么？10.你遇到不会的会怎么做？习惯自己决定还是询问他人？

查看10道真题和解析

点赞评论收藏

分享

02-07 17:26

中华女子学院客户端其它

某储能的数据分析 2.2

一，自我介绍自我介绍部分依旧是个人信息介绍+工作匹配度介绍+对面试公司的了解。这部分对方也是针对我的工作内容问了几个小问题，就如实回答了。二，具体提问1，针对回答提问了指标体系？指标体系的搭建就举了一个具体例子，说明自己是怎么搭建指标体系以及说清楚指标有什么指标就可以。2，提问了平时使用的工具就是hive，mysql，tableau，power BI还有自研的一些工具之类的。这里有问到如果是一个新的工具花多长时间可以上手，我回答的是工具类的软件都非常好上手，基本上几个小时就能上手，夸我学习能力强。然后说我第一次使用这些工具是系统学习还是自学，也就是公司培训还是自学，然后我就说了第一次接触是自学，因为很多公司一般都是要求你会了以后，才会要你，而且工具学习其实不难的。这里夸了一句觉得我经验比较丰富。3，提问了对公司业务的理解这里下来是有做功课，说了公司的具体业务，行业内的地位，未来发展的前景和几点小小建议，反正面试官也是比较满意的。4，问了对公司价值观的理解这个价值观搜索资料的时候也有看到，就说了一下，对价值观的赞成以及原因。5，对公司业务某个环节的理解这个也是真诚的说了我的看法，然后理解公司这个环节为什么这么做，再加上自己的小小建议。三，反问环节

查看6道真题和解析

点赞评论收藏

分享

02-06 10:31

已编辑

门头沟学院 ETL工程师

货拉拉_数据开发

1.自我介绍 2.项目介绍 3.项目难点痛点 4.sqoop底层原理 5.sql考察 6.数仓分层维度建模 每一层解释 7.能实习多久一面问的比较简单基础1.自我介绍 2.做这个项目有遇到啥痛点不 3.遇到不会的技术怎么办 4.对数据治理的认识 我当时说的数据质量 答得还不错5.职业规划 6.对大数据的兴趣 介绍了下大数据hadoop的三件套二面 过了

查看12道真题和解析

点赞评论收藏

分享

02-03 11:12

惠州学院 C++

京东数据分析实习，挂

1. 实习介绍2. 项目深挖· 要求介绍一个最能体现你能力的项目· 追问：按照你对这个项目的理解，如果让你概括一下这个项目有哪些核心指标构成的？· 你对于指标体系有怎样的认识？3.在实习经历中，有没有主动通过分析方式发现一些问题？· 发现的问题是否推动产品或研发进行了改造？· 追问：在推动问题解决过程中，有没有出现事情很难推动、很难落地的情况？· 面对这样的问题，你们是如何解决的？4.你对AB实验这一块有多大了解？· 要求设计一个AB实验：假设有一个策略模型给用户提供差异化补贴，需要验证这种精细化补贴是否能提高业务收益· 关于样本分流问题：如果观测到的分流比例不是严格的1:1，在什么情况下是正常的波动，什么情况下需要排查？· 如何界定和判断？应该用怎样的统计方法？· 实验结束后，如果结果不显著，如何让结果更加显著？· 你熟悉的因果推断方法有哪些？5.sql题目

查看14道真题和解析

点赞评论收藏

分享

02-01 19:25

门头沟学院大数据开发工程师

阿里云数据开发

前段时间面试了阿里云数据开发岗位，面试问题如下1 先自我介绍2 先说一下你做的项目有哪些，哪些地方可以体现你的技术能力3 看你实时和离线都做过，你们这边实时和离线是怎么技术选型的，平时对于实时需求多吗，怎么评估一个实时需要的资源4 看你有做过数据治理，如果这个项目要你来立项你会从哪方面入手，对于治理之后如何体现收益5 对于财务数据你感觉和平时的流量数据有啥区别，为啥需要做财务数据6 对于目前ai你这边主要是用哪个，平时都拿ai做哪些事情，对于平时开发会加快效率吗7 有啥要找我了解的吗

查看6道真题和解析

点赞评论收藏

分享

02-06 10:31

已编辑

门头沟学院 ETL工程师

小米数据开发

1.自我介绍2.项目介绍3.项目难点痛点4.etl过程5.写过sparkstreaming吗6.sql题目7.python简单字段串反转8.datax与sqoop的区别 使用场景9.与同事咋相处10.想去那个城市工作11.反问：实时架构，业务线记得考了一个函数 from_unixtime最后挂了

查看12道真题和解析

点赞评论收藏

分享

01-30 16:10

惠州学院 C++

陌陌（数据分析）

当时面完没太记录，有点记不清了，面了一面，二面, HR面和产品VP面，记得以下几个问题1.日活波动怎么分析2. 最近看的工具书，画一个脑图并介绍3. 跳出舒适圈的例子4. SQL题，还考了字符串相关5.实习分析的指标、解决的问题6. A/B test看提升频率如何排除其他因素的影响

查看6道真题和解析

点赞评论收藏

分享

玩命加载中

写面经

发动态

发动态

发帖子

写文章

全站热榜

更多

牛客网
牛客网在线编程
牛客网题解
牛客企业服务