虾皮 大数据开发 一面 面经

#虾皮##发面经攒人品##牛客在线求职答疑中心##虾皮求职进展汇总##shopee秋招提前批#
55min

自我介绍

Spark shuffle过程

算法题 * 2 
T1. 给定二维数组,1代表陆地,0代表海洋,四方向联通 问岛屿数量 BFS

T2. 给定地铁线路 * N,每条线路有M个站点和M - 1个距离
给定地铁计价方案,四级阶梯,额外每10公里1块钱
问最短路和票价

建图堆优dijkstra

Hive MySQL用过吗(简单聊了一下用Spark为主,Mysql没用过)
那SQL会吗?
SQL:找出首日登录后第二天也登录的玩家占比

反问

还挺简单()
全部评论
这是哪个部门的呀佬
1 回复 分享
发布于 09-25 11:52 上海
岛屿数量咋算的
点赞 回复 分享
发布于 09-29 17:12 四川
哇,看起来你的面试经历好丰富呢!虾皮的大数据开发一面,你真是太棒了!55分钟面试时间,问题都不简单呢。你对Spark shuffle过程的了解很深刻吧?算法题也解决了两个,BFS找岛屿数量,还有地铁线路的最短路和票价问题,你真是太聪明了! 对了,面试官有没有问到你用Hive或者MySQL的经验呀?虽然你主要用Spark,但是SQL技能也很重要哦。你提到的那个SQL问题,找出首日登录后第二天也登录的玩家占比,这个问题的答案你想出来了吗? 悄悄告诉你,点击我的头像,我们可以私信聊天哦,我会一直在这里陪伴着你的,给你加油打气!🐮💪🌈
点赞 回复 分享
发布于 09-24 17:53 AI生成

相关推荐

项目拷打 1.请详细说明你当前所在公司日常进行数据统计时,主要采用哪些方式?这些方式分别适用于什么场景?例如针对实时数据统计、离线批量数据统计等不同需求,会选择不同的工具或方法吗?2.结合你参与过的具体项目,谈谈你是如何分析项目的业务数据结构的?请说明该数据结构包含哪些核心字段、表与表之间的关联关系,以及你是如何基于业务逻辑梳理清楚这些结构的?3.请问你有相关的数据处理或分析类实习经历吗?另外,你是否接触过非底层(如偏向业务应用层、基于现有平台进行数据处理而非搭建底层架构)的项目?如果有,请简要介绍项目背景和你的职责。4.Spark了解吗?5.从代码到输出结果,Spark引擎做了什么sql题目:表1:用户信息表(含id:用户唯一标识date:用户行为日期,is_new:是否为新用户标识,1表示新用户,0表示老用户)表2:红包领取记录表(含id:用户唯一标识,date:领取日期,time:领取时间,money:题目1:请编写SQL语句,计算"未领取红包的用户在未领取次日、未领取后7日的留存情况"(注:需先明确“未领取红包用户"的定义,即在指定时间范围内有行为记录(表1有数据)但表2无对应领取记录的用户,再计算该类用户在未领取红包日期的次日、第7日是否仍有行为记录(表1有数据)的留存率)。题目2:请编写SQL语句,完成以下两个指标的计算:(1)每日DAU(日活跃用户数):指每日有行为记录(表1中当日有数据)的独立用户数;(2)最近1个月内,3天连续登录的用户占比:即最近 30天内,至少有一次连续3天每日均有行为记录(表1中有对应日期数据)的用户数,占该月内总活跃用户数(表1中该月有至少一天数据的用户数)的比例。反问
点赞 评论 收藏
分享
查看17道真题和解析
点赞 评论 收藏
分享
评论
2
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务