字节安全风控数开实习一面凉经

针对简历的项目提问，
介绍一下mapreduce的过程，
spark的优势，
数据倾斜的解决方案，
数仓分层的好处，
介绍一下flink,
如何实现精准一次
sql题：现在有一张表存的是这两个字段，student_id, score 数据格式如下，lihua01,['math':98 english':87, chinese':99].
写一个hivesql实现查询每个学科排名第三名的同学

sql题：hivesql实现查询今日订单量是过去7日订单量均值的2倍的商家id

#牛客AI配图神器#

全部评论

推荐最新楼层

牛客849740264号

联想_算法工程师

校友啊，数开看看我们这里呀，我可以帮你tui

1 回复分享

发布于 04-16 17:14 天津

04-12 16:00

武汉理工大学大数据开发工程师

大数据相关面试题合集数据人的面试交流地

点赞评论收藏

04-22 23:47

东南大学算法工程师

决赛圈offer选择

投票

本人南信大本东大硕1.南京焦点科技AI工程师19 * 14,  公积金10%,8.30-5.30,双休,进去第一年实习,薪资8折,包三餐有房补2.南京钢铁人工智能院,hr预估24左右, 公积金12%,8.00-5.00,双休(员工级),加班时没有加班工资,因为本地人所以没有房补麻烦各位给点意见,本人偏向焦点科技,感觉以后可以往更高的平台走#小红书求职进展汇总##我的求职精神状态##好未来求职进展汇总##牛客创作赏金赛#

小红书求职进展汇总我的求职精神状态

点赞评论收藏

04-25 22:24

武汉理工大学大数据开发工程师

4.25腾讯云智数开一面

1. 基本情况方向：数据工程，时间：40分钟结束、16:00开始，无手撕，多场景2. 自我介绍3. 一些能够回忆起来的（或许有不正确的地方）：（1）提问R：你这个项目是课程作业还是什么？R：那你说说Hive和ClickHouseR：你谈到了OLAP，那和OLTP有啥区别？R：没了？ClickHouse适合那种场景？R：可以用作实时数仓吗？R：课程中有数据库相关的吗？只有数据结构与算法？R：MySQL系统学习过吗？R：数据怎么导入到ClickHouse的？R：直接到ClickHouse？R：数仓分层？四层讲讲。R：那为什么要分层呢？DWS已经差不多了为什么还需要ADS呢？R：场景题：在你的表上新...

牛客861513826号：A场景题：数量统计不说了；退货平均时间：先沟通清楚，月平均退货时间算不算上不退货的用户，不算的话，就只计算退货用户；一个用户的退货时间减去到货时间拿到这件商品的退货时间，然后计算每个退货用户的退货时间，AVG开窗partition by月份，计算出每个月的平均退货时间。如果要算上不退货的用户，也就是让这个用户的退货时间是0，然后对所有用户计算AVG同上。 B场景题：结合下面他提示你再想想数据倾斜，其实这道题是想靠你数据倾斜怎么解决；本来是一个商品购买信息表，记录商品信息和购买者信息，如果给购买者信息加上性别，要求算出每个商品不同性别的购买人数。百分之八十女性用户，所以如果单纯对表进行分组聚合，会产生数据倾斜问题，由分组聚合产生。五种办法可以解决，两种hive参数，三种SQL，往SQL方向聊，以防他追问参数底层，参数这种东西最难聊了，别给自己挖坑