虾皮26秋招大数据开发二面75min

项目拷打
1.请详细说明你当前所在公司日常进行数据统计时,主要采用哪些方式?这些方式分别适用于什么场景?例如针对实时数据统计、离线批量数据统计等不同需求,会选择不同的工具或方法吗?
2.结合你参与过的具体项目,谈谈你是如何分析项目的业务数据结构的?请说明该数据结构包含哪些核心字段、表与表之间的关联关系,以及你是如何基于业务逻辑梳理清楚这些结构的?
3.请问你有相关的数据处理或分析类实习经历吗?另外,你是否接触过非底层(如偏向业务应用层、基于现有平台进行数据处理而非搭建底层架构)的项目?如果有,请简要介绍项目背景和你的职责。
4.Spark了解吗?
5.从代码到输出结果,Spark引擎做了什么
sql题目:
表1:用户信息表(含id:用户唯一标识date:用户行为日期,is_new:是否为新用户标识,1表示新用户,0表示老用户)
表2:红包领取记录表(含id:用户唯一标识,date:领取日期,time:领取时间,money:
题目1:请编写SQL语句,计算"未领取红包的用户在未领取次日、未领取后7日的留存情况"(注:需先明确“未领取红包用户"的定义,即在指定时间范围内有行为记录(表1有数据)但表2无对应领取记录的用户,再计算该类用户在未领取红包日期的次日、第7日是否仍有行为记录(表1有数据)的留存率)。
题目2:请编写SQL语句,完成以下两个指标的计算:(1)每日DAU(日活跃用户数):指每日有行为记录(表1中当日有数据)的独立用户数;(2)最近1个月内,3天连续登录的用户占比:即最近 30天内,至少有一次连续3天每日均有行为记录(表1中有对应日期数据)的用户数,占该月内总活跃用户数(表1中该月有至少一天数据的用户数)的比例。
反问
全部评论

相关推荐

03-04 01:37
算法工程师
bg: 985本硕。现在主要研究视频生成,之前做过3d/4d、多模态(和推荐相关)。3个offer:1. 字节广告算法,1-2,n*15+3w期权。优点:字节的广告算法行业内应该算top级别,团队leader人也非常好。缺点:和个人背景没有那么匹配,也没有那么感兴趣,2. 卓驭科技(前大疆车载)多模态大模型(视频生成、vla等方向),(n+10k)*(12-17)。优点:薪资确实比字节高很多,方向也喜欢,个人觉得智驾和具身智能未来发展空间很大,哪怕未来智驾和具身未来不行,应该也可以跳槽到别的行业,毕竟做大模型的。缺点:强度应该比字节稍大,其他福利待遇比字节差一些,年终奖无保底(hr说绝大部分都能拿到4个月年终奖),公司在智驾行业不算第一梯队,网上信息也比较少,不清楚到底咋样,未来稳定性、业务发展、行业认可度(据hr说公司员工跳槽出去,行业认可度很高)等都不太清楚,但是看算法团队硕博比例很高,人才密度比较高,技术水平应该也还行。3. 华为2012实验室ai多模态(软件特战队),15a,40-50w。hr说进去之后会根据个人意愿匹配到对应的项目组,但是看网上有人说这个很坑,进去之后随便分,看运气,都是做算子开发的。面试过程也几乎没怎么问ai算法相关的,感觉面试官根本不懂ai算法。暂时不考虑华为了。求帮选,或者给些建议和信息,感谢。
校招薪资来揭秘
点赞 评论 收藏
分享
评论
点赞
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务