Soul数据分析社招面经

一面:

  1. 指标下跌如何归因?A/B型指标下跌怎么归?除了拆维度还用过什么方法?为什么选择现在的方法
  2. 项目经历(特征值如何处理?为什么用这个方法等?
  3. 反问

二面

主要围绕项目经历展开:目的?方法?怎么落地的?是独立完成的吗?

三面

  1. 好的指标体系是怎样的
  2. 如何确保指标体系是有序的?如何划分指标体系的层级?
  3. 用什么衡量用户xx行为的深度?
  4. 如何进行异动分析?
  5. A*B = C类型的指标,如果C下降了,如何归因?
  6. 讲一个项目,涉及聚类:
  • 用的什么聚类方法?为什么用这个?
  • 用了什么特征?如何做的特征处理?
  • 如何确定要聚成这几类?
  • 数据量的大小?
  1. 还有什么涉及模型的项目?XGB相关的
  • XGB都有什么参数?
  • 为什么用这个模型?和其它决策树相比有什么差异?
  1. SQL的执行顺序?
  2. pandas用什么包?缺失值怎么处理?

hr面

忘了...

差不多每隔一周面试一次

#社招##数据分析师##面经#
全部评论
除了拆维度还用过什么方法?这个能请大佬稍微解释一下嘛
点赞 回复 分享
发布于 2021-10-31 11:06
求补题解,交流交流
点赞 回复 分享
发布于 2021-10-26 21:13
楼主拿到offer了吗?
点赞 回复 分享
发布于 2021-10-23 19:44

相关推荐

不愿透露姓名的神秘牛友
2025-11-30 22:58
字节跳动 数据开发 26*15 本科211
点赞 评论 收藏
分享
2025-12-14 09:20
门头沟学院 Java
1.项目介绍2.说一下你在里面参与的业务流程吗,整个系统3. 为啥会选用netty做这个二进制流的解码跟这个传输的一个框架呢?之前有没有评估过别的网络框架4.你的上游是什么模块,上游是怎么给你推二进制流的5.你的行情模块接入层是单体的吗?6.你们的ConcurrentHashMap是怎么设计的?这个Map 存在一台机器上,其他机器要用怎么办?7.如果这个 Map 丢了,比如服务重启了,数据怎么恢复8.如果单纯是存历史数据风控要用,那你Map只存最新的?那风控历史数据从哪查9.你们是写入Map后异步写Redis,对吧?那中间宕机了,Redis还没写成功,这条数据不就丢了?你们怎么保证数据不丢?10.你觉得 Redis 是强可靠的吗?如果 Redis 挂了你们怎么办11.什么是长连接?NIO 和 BIO 的区别讲一下吧12.所有上游都能跟你建立长连接吗?有没有场景不能建立长连接?那你们怎么处理?13.前面你说到的短连接和长连接混用,那这种情况下顺序怎么保证?有没有旧数据覆盖新数据的问题14.那如果你这边有多台机器,同时处理请求,怎么保证同一条行情数据不会被覆盖?顺序怎么保证?15.RocketMQ 是在哪一段用的?是在接入层之后就直接发MQ了吗16. MQ是怎么做分区的,你提到要隔离,那你只是broker隔离,消费端没有做隔离的话有啥意义17.MQ发消息用线程池是吧?那线程池参数是怎么配置的18.业务里为啥要用一个Map缓存行情?不是直接往下推就好了吗,还有你这个Map有没有读的链路?如果没有get操作,这个Map的存在意义在哪19. 那你说你重启后需要恢复数据,如果我们不用ChronicleQueue、Disruptor这些WAL预写,只用 Redis + MySQL,你怎么设计才能保证数据可靠20. Redis双机房是怎么做容灾的?同步是强同步还是异步的?中间挂了数据丢不丢21.有没有幂等场景?比如别人调你下单接口,你怎么实现幂等?是怎么返回给上游的22. 重试的时候你幂等怎么保证?怎么区分要返回什么呢23.问个MySQL的问题,MySQL里面那个b➕树它是双向链表还是单向链表,为什么24.手撕:1.给你一个数组,比如 [5,7,1,2,10],表示二叉树中序遍历的结果是节点 1,2,3,4,5,它们对应的分数分别是 5,7,1,2,10。2.要在所有符合这个中序顺序的二叉树中,找到“加分”最高的那棵
查看24道真题和解析
点赞 评论 收藏
分享
评论
8
84
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务