拼多多数据分析面经

拼多多
一面面试官有眼缘给我过了,二面没过,分析原因:
1. sql要提升。有关**率,窗口函数要提升
2. 简历。控制器下发有关的内容要说的更专业从容一些,CNN的东西一点都说不出来
3. ai基础知识。相关经历一点没有,基础内容也说不出来
4. 假设检验。相关应用题需要补足更了解一些

一面:
1. 手撕代码,给一个列表,连续增长的数最长(ac),不一定连续增长的数最长(不会)
2. sql题目:ssid,start_time,end_time
  2.1 分ssid找出最早的start_time
  2.2 哪一时刻的ssid数量最多
3. 简历:在华为期间补丁具体做了什么,详细描述
4. 统计:
  4.1 说说怎么看相关性
  4.2 500个人做实验,300个人实验结果是药物有效,200个人实验结果是无效,怎么通过统计的方法确认有效还是无效
5. 博弈论海盗分金币问题

二面:
1. 一道sql:计算第一次购买在8月,第二次购买小于30天的留存率
2. 一道sql:计算电影开场10分钟内,观看电影人数占总人数比率
3. 具体讲讲简历里干了什么?场景?
4. dhcp是七层协议的哪一层?udp还是tcp?之前的工作地点?属于研发吗?具体dhcp的流程
5. 了解ai吗?讲讲ai相关的经历。为什么要用CNN进行曲线拟合?

二面挂了,主要因为最后ai相关的一点讲不出来,sql写的也一般
全部评论

相关推荐

11-08 16:10
门头沟学院 Java
1. 介绍实习工作2. 面试官让我言简意赅地回答,不要展开太详细,主要要围绕你针对什么问题,做了什么事,实现了什么效果3. PD分离部署是什么意思,为什么能够提高吞吐量(实习)4. 面试官主要想听到,prefill阶段是计算密集型任务,decode是内存密集型任务5. 模型服务部署成功后,用户输入一个信息,在PD分离部署下数据链路是怎么样的6. 项目里写的定义的监听器为了保证数据的一致性,这里的数据一致性是指什么数据,他们为什么会不一致,是如何同步的7. K8S的pod之间是如何通信的8. docker的原理,它和传统的虚拟机有什么区别,它有什么优势9. 项目里写了优化数据库和缓存,是如何优化的10. 为什么要建覆盖索引11. 什么场景下会建立覆盖索引,建立了覆盖索引为什么速度更快12. 索引表里面会存数据吗?13. mysql的底层数据结构是什么?14. 为什么要用B+树不用其他数据结构15. redis的I/O多路复用16. ip和tcp协议的作用17. tcp协议是如何保证数据的可靠传输的18. 重点不在三次握手,握手只是方式,要答序列号同步、确认机制类似的这些19. tcp包的序号是如何定的,比如我有一个很大的包,分成了50份,这50个数据包是如何编号的20. 手撕一个计算器,输入一个字符串,输出答案,字符串只包含括号和+、-
查看17道真题和解析
点赞 评论 收藏
分享
这一次面试真的很感慨,能走到三面已经是我意料之外了。非常感谢我遇到的各位面试官,很和蔼,我不会的问题引导着我去思考,我也深刻地认识到我对于各个组件的底层原理理解的薄弱。一面:拷打了一些八股,对于我简历上的项目问了更深的一个层次,我勉勉强强回答上来,在问的过程中问到了一些偏底层的东西,比如说:C++在分配内存,操作系统,CPU等都做了些什么工作,为什么能够分配内存等。手撕了一道算法题,秒了。二面:被匹配到了基础平台研发部门,不得不承认这个部门的面试很难,开局手撕了两道算法题,秒了。然后没有问任何项目相关的问题,问了很多基础的知识,又一次问到了C++智能指针相关,C++虚拟内存分配等,malloc分配内存的全过程(如前128K使用了哪些系统调用,后面使用了哪些系统调用,这些调用做出了哪些优化等);TCP相关的一些知识;僵尸进程等相关知识点。答得磕磕绊绊,面完半个月没有信息,以为挂了,结果走到了三面。三面:面试官是一个很和蔼的大叔。当时的面试状态也非常糟糕,面的一塌糊涂,把面试官都面笑了,不知道该问我什么了。先是根据之前的面评,问了更底层的智能指针(共享指针部分)让我手写一个共享指针(非模板库)。我对于这些知识很多仅限于理论,平常都是写一些算法,项目上只是会用即可,有时候用法也记不清需要现查,确实很少用过这些。我凭借着印象大概描述了一下,存在优化上的问题。后面谈到了交叉引用,面试官让我用模板库里的实现一个交叉引用的案例,实话实说,想不起来。后面面试官又挑了redis问了关于快照与日志相关的问题,问到了快照在内存上是如何操作的,在保存为快照的过程中依旧会有缓存的更新,redis与操作系统都做了哪些工作等。不会,我凭理解与印象回答了一部分,答得不对。等等等等,一大堆抽象的事情。手撕代码并不是算法题,没有写过这种题,不会,真的想不出来。大致意思是有一个链表,你不能将其放到内存中,你有一个函数getnext可以取下一个数据,你不知道有多少个数据,你有一个函数next可以判断是否还有下一个。现在你需要随机的等概率的取出K个节点(每一个节点被选择的概率均为一样的),我的思路被驳回了,链表只能扫描一遍,不能重复扫描,各个节点之间被选择必须是独立的,选择节点必须是等概率的。最后没写出来。挂了。很难受很惋惜也很感慨。也怨不得别人,菜了就是菜了,挨打就立正。下去接着下功夫吧,只能看客户端能不能把我捞起来,或者春招再战。不过拼多多的工作强度确实很大啊,哈哈,一面的面试官一脸的憔悴,黑眼圈特别大。
查看11道真题和解析
点赞 评论 收藏
分享
11-20 01:20
门头沟学院 Java
1.项目介绍2.那个Netty框架是干嘛用的,这个“行情客户端”是长连接还是短轮询的3.了解Netty的线程模型吗?像主线程、worker线程,这些是怎么协同工作的4.如果Netty服务正在处理数据,结果服务突然发版了,你怎么保证这时候数据不丢,你们业务是怎么处理的呢5.不是说用了RocketMo 做分发吗?那你这块做限流的逻辑是在发送端还是消费端?你这个限流跟MO是什么关系6.如果消费端的 OPS 降下来了,发送端会联动做降频处理吗?有没有设置什么反馈机制7.本地缓存如果有做,那万一你发版了,缓存还没刷出去数据会不会丢?这块你们这么考虑的8.RocketMO生产的时候怎么保证一个特定的消息一定会发到同一个队列上9.RocketMO 和 Kafka区别10.Sentinel集群限流的时候,请求如果都打到tokenserver,那高 QPS 场景下效率不是很低吗?你们怎么保证这块不拖慢链路11.关于Netty我问你个线上问题哈--我们发现有时候句柄都创建不了了,句柄上限我们配的是6万个也不是特别少那你会从哪几个方面去排查这个句柄创建失败问题?12.如果有一批连接都在 TIME WAIT,你怎么判断这些是不是正常的?还是短连接频繁导致的?13.TIME WAIT 太多了怎么优化14.如果连接状态是 CLOSE WAIT呢?你怎么分析15.问一下ivm里面的问题,CMS 和 G1 之间的核心区别是哪柴16.有个问题啊,像你用线程池去异步处理业务时,有时候要传递上下文信息,那ThreadLocal怎么传进线程池里?会不会有问题?你们用什么方案来保证不丢上下文17.MySOL事务ACID 四个特性说说是怎么实现的18.那你有没有遇到死锁问题?在什么场景下 MySOL的死锁容易出现?你是怎么排查的?19.死锁发生时,InnoDB 是怎么处理的?会怎么判断哪一个事务要被回滚?20.除了 MySQL行式存储,你了解列式数据库怎么实现事务的21.TiDB的事务模型你了解吗22.最近有没有学什么最新的技术23.手撕:十六进制大数加法:有两个由链表表示的数字,数字为16进制且数字可能很大,计算两数之和
查看23道真题和解析
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务