【面经】SOUL 数据挖掘实习(凉)

投递+约面:一天
面试时长:30min
面试方式:电话面试

Q1:自我介绍
Q2:SQL编程题四道。一道是join leftjoin rightjoin的不同点,一道是where groupby having orderby的顺序,一道是窗口函数,一道是求一个月内连续登录三天及以上的人数。
因为不太了解最后一道题的常规解法我用了lag函数,面试官不断引导要说出最简单的SQL方法,纠结了差不多5min搞定。
Q3:python理论题两道。loc/iloc区别,正则表达式。
Q4:申请这个岗位的优势和劣势
Q5:数据分析的流程
Q6:反问(上班时长10-7.30,必须保证每天在公司>9.5h让我有点劝退)

反思:
自我感觉面试还挺好面试官理论也很扎实态度很亲切但是也凉了。
最开始我接到HR电话约面试已经接近春节,我就提出春节之后面试,HR就非常不耐烦且急切的要求必须在节前面完,遂约在节前最后一天的晚上七点,个人观感不是很好感觉像是必须走过场一样。
常见的SQL题最好还是背标答,其他方法也能做但是他们更喜欢最精简的答案。
#实习面经##面试题目##Soul#
全部评论
在哪投的呀
点赞 回复 分享
发布于 2022-02-24 15:06
加油,多面一些,积累经验也是很重要的
点赞 回复 分享
发布于 2022-02-23 13:28
想问一下 面试没有问关于简历和算法的问题吗。。?
点赞 回复 分享
发布于 2022-02-12 21:44
请问这个是数据分析岗吗 还是数据挖掘岗
点赞 回复 分享
发布于 2022-02-10 22:22

相关推荐

2025-12-14 09:20
门头沟学院 Java
1.项目介绍2.说一下你在里面参与的业务流程吗,整个系统3. 为啥会选用netty做这个二进制流的解码跟这个传输的一个框架呢?之前有没有评估过别的网络框架4.你的上游是什么模块,上游是怎么给你推二进制流的5.你的行情模块接入层是单体的吗?6.你们的ConcurrentHashMap是怎么设计的?这个Map 存在一台机器上,其他机器要用怎么办?7.如果这个 Map 丢了,比如服务重启了,数据怎么恢复8.如果单纯是存历史数据风控要用,那你Map只存最新的?那风控历史数据从哪查9.你们是写入Map后异步写Redis,对吧?那中间宕机了,Redis还没写成功,这条数据不就丢了?你们怎么保证数据不丢?10.你觉得 Redis 是强可靠的吗?如果 Redis 挂了你们怎么办11.什么是长连接?NIO 和 BIO 的区别讲一下吧12.所有上游都能跟你建立长连接吗?有没有场景不能建立长连接?那你们怎么处理?13.前面你说到的短连接和长连接混用,那这种情况下顺序怎么保证?有没有旧数据覆盖新数据的问题14.那如果你这边有多台机器,同时处理请求,怎么保证同一条行情数据不会被覆盖?顺序怎么保证?15.RocketMQ 是在哪一段用的?是在接入层之后就直接发MQ了吗16. MQ是怎么做分区的,你提到要隔离,那你只是broker隔离,消费端没有做隔离的话有啥意义17.MQ发消息用线程池是吧?那线程池参数是怎么配置的18.业务里为啥要用一个Map缓存行情?不是直接往下推就好了吗,还有你这个Map有没有读的链路?如果没有get操作,这个Map的存在意义在哪19. 那你说你重启后需要恢复数据,如果我们不用ChronicleQueue、Disruptor这些WAL预写,只用 Redis + MySQL,你怎么设计才能保证数据可靠20. Redis双机房是怎么做容灾的?同步是强同步还是异步的?中间挂了数据丢不丢21.有没有幂等场景?比如别人调你下单接口,你怎么实现幂等?是怎么返回给上游的22. 重试的时候你幂等怎么保证?怎么区分要返回什么呢23.问个MySQL的问题,MySQL里面那个b➕树它是双向链表还是单向链表,为什么24.手撕:1.给你一个数组,比如 [5,7,1,2,10],表示二叉树中序遍历的结果是节点 1,2,3,4,5,它们对应的分数分别是 5,7,1,2,10。2.要在所有符合这个中序顺序的二叉树中,找到“加分”最高的那棵
查看24道真题和解析
点赞 评论 收藏
分享
评论
2
14
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务