滴滴顺风车数据分析面经

日常实习

总评:面试体验感觉较好,没有压力面,主要侧重于简历的深耕,建议大家好好准备项目的细节,同时复盘的时候除了细节,还需要思考以自己当前的视角,是否该实验还有优化的地方。

细分题:(一、二面题目整合在一起了)

  1. SQL 题

用户表:用户id (年龄/ 性别)

订单表:日期,用户id,订单号

a. 选取每日订单数排名前三的用户id和订单数

select *
(
  select *, rank() over(partition by date order by cnt desc) as rnk
  from
    (select date, user_id, count(order_id) as cnt
    from orders o left join users u 
    on o.user_id = u.user_id
    group by date, user_id) tmp1
  ) tmp2
where rnk <= 3

b. 看每日新用户的完单量

select date, count(order_id)
from orders inner join 
  (select user_id, min(date) as date
   from orders
   group by user_id
  ) tmp on orders.user_id = tmp.user_id and orders.date = tmp.date
group by date


  1. 深耕简历
    1. 用户转化分类模型的特征是如何选取的?评估指标?重新设计如何优化实验?

主要拆解用户转化路径中,用户对于销售服务的反馈来提取特征,并且基于随机森林的特征重要性评估来选取特征。采用AUC面积来评估效果。

(优化实验部分建议准备下,除了复盘整体的内容也需要重新评估下是否有优化的点,我这个题目答的并不好。)

    1. 讲下假设检验?建立原假设和备择假设,通过证明在原假设成立的前提之下,统计样本量出现当前值是小概率事件,从而推翻原假设,以接受备择假设。


  1. 反问
    1. 日常工作? 基础指标维护,看板搭建;策略效果评估;实验性探索(ABTest)
#滴滴##面经##实习#
全部评论
这几个 sql 都写得很好
点赞 回复 分享
发布于 2022-05-13 09:38
滴滴应该不能转正的,即使他们说有hc
点赞 回复 分享
发布于 2022-03-30 14:00
你好!请问楼主面的是增长分析组吗!
点赞 回复 分享
发布于 2022-03-16 18:44
感谢分享!楼主有没有拿到offer呀
点赞 回复 分享
发布于 2022-03-16 17:13
感谢分享!祝楼主好运!
点赞 回复 分享
发布于 2022-03-14 11:26

相关推荐

面试官人很好,态度和蔼可亲,没答出来时也会引导你去思考。由于是晚上面的,导致我白天一天都有点紧张,面的时候状态也不是很好,正常可能面试官提问完应该思考几秒再答,而我就像抢答一样一口气把所有会的都说出来,这样就导致逻辑比较混乱,东一句西一句的。首先是自我介绍,先把会的技术大致讲一下,由于我八股背的多所以着重讲了一下,Java,go,jvm,MySQL,Redis,计网,操作系统这些,然后一小部分闲聊,然后先问了一下项目,面试官问我这个项目是否落实之类的,直接坦言说是写的练手的,包括之前也写过IM通讯,外卖之类的。然后面试官就把提问的重点放在了八股上。先问了Java:类加载器(答:3种+自定义类加载器、tomcat、原因+双亲委派+好处)JVM参数(答:xmx,xms,newsize这些,问我是如何设定的,我回答是把内存分一半给堆,再把堆分一半给新生代,这方面确实不太了解)然后问了一下并发相关的:线程池(答:线程池的7个参数(忘了线程工厂和阻塞时间了),3个重要参数,还有线程如何启用,为什么要设计最大线程数之类的,提到Java栈默认分配1MB运行时不可以更改)AQS(答:先讲clh是自旋锁+list,然后是AQS在这个基础上做的两个优化,然后举了一下reentrantlock根据state如何获取资源)CAS(答:使用三个字段,aba问题,然后将通常搭配自旋锁实现,面试官问通常会自旋多少次,这个不太了解,答的100,然后问100次大概多少秒,回答微秒级,然后面试官讲了一下怎么做资源可能没用完,意识到可能还需要进行阻塞操作)然后考虑一下Linux命令(top,ps,如何使用管道符过滤线程和使用Linux启动线程没答出来)然后问Redis:持久化机制(答:三种aof,rdb,混合,aof的三个参数刷盘策略,rdb以快照保存,使用bgsave会使用子线程来保存不会阻塞,而aof虽然会阻塞但是只在写完数据后追加一条命令,不会太影响,然后是他俩的优缺点,还有混合是怎么保存数据的)集群模式(答:三种,主从复制到缺点再到哨兵机制,正常使用三个哨兵互相监督,主节点挂了投票选主哨兵然后选主节点,然后额外讲一下脑裂的问题,主节点进行数据更新然后把命令写入aof来同步从节点,最后cluster集群,如何实现,使用16383个哈希槽(艹答成16384了),先根据哈希码取余,再根据节点数取余决定放在哪个节点上,然后问了一下我会怎么选集群模式,首先是cluster的问题,会让管道操作之类的失效,然后哨兵会导致整个集群结构变得复杂,使用小项目可能会考虑哨兵,大的考虑cluster,然后考了一下cluster如果一个节点挂了怎么办,根据节点数重新取余然后数据转移,面试官说这么转移比较慢,有没有别的办法,我隐约记得使用一个类似环形数组的方式,想不起来了)然后考了一下MySQL的b+树(这方面的知识点太多了,导致我什么都想讲逻辑就比较乱,讲了一下聚簇索引,树的叶子节点对应着一张页16KB,MySQL有一个区的概念,把这些页放在同一个区中,这样叶子节点的双向链表遍历时速度更快,然后b+树的扇出比较大(非常二,说成扇度之类的,面试官以为说的是扇区)这样层数就比较小,一行1kb数据的话3层可以放心2000w数据)其他的暂时想不起来了算法是lru,面试官问要不要提示,我说写个,然后写了10分钟左右,说大概写好了,但是面试官指出了2个小错误,第一个马上就改回来了,第二个一直没看出来(大脑这时候已经停止工作了)反问:问学习建议,说根据实际的项目进行深入,考虑应该怎么做,还问了一下组里面是做Java的吗?面试官说他是做go的,组里什么语言都有,语言影响不大,连忙补充了一句我对go的底层有深入源码的学习)结束。总体感觉答得不太好,没有太体现出深度,细节也不够全面。
下一个更好呗:佬,我投完云智一直没消息,多久约的一面啊
查看14道真题和解析
点赞 评论 收藏
分享
05-30 13:04
已编辑
门头沟学院 算法工程师
智谱和米哈游都是ai大模型agent的业务钱的话还是米更多,几乎翻倍了,有没有老哥是两个公司其中一个的,能问问转正率咋样嘛,我问的hr回答都是做的好就可以转正暑期实习
码农索隆:选米哈游:短期高薪、敢承担风险、具备强创新能力,且愿押注游戏AI赛道。 选智谱:稳定性与行业通用能力积累,接受薪资差距以换取更稳妥的职业基础。
投递北京智谱华章科技等公司9个岗位 > 实习期间如何提升留用概率?
点赞 评论 收藏
分享
评论
7
89
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务