某公司-大数据开发-笔试题
两道sql
1. 分组top n
课程id,学生id, 分数,求每个课程前两名的学生
2.最大连续收入天数
收入income, 用户 user_id , 日期 date_id, 给定30天的数据,求用户有输入的最大连续天数。
我理解错了,写成用户的最大的没有连续收入的天数
使用lead打标记
实际上使用sum() 开窗在分组就可以做了。
然后还有就是
五道选择题
1.存储过程, hdfs读写流程原理, python语法等
五道多选题
1. 数据分类标准
2. 数仓的一致性校验等
五道简答题
1.sql两道
3. spark数据倾斜
4.数据在数仓的生命周期,如何实现
5. 数据质量如何实现,具体说明
值得一提的是使用在线牛客网面试,限时
1. 分组top n
课程id,学生id, 分数,求每个课程前两名的学生
2.最大连续收入天数
收入income, 用户 user_id , 日期 date_id, 给定30天的数据,求用户有输入的最大连续天数。
我理解错了,写成用户的最大的没有连续收入的天数
使用lead打标记
实际上使用sum() 开窗在分组就可以做了。
然后还有就是
五道选择题
1.存储过程, hdfs读写流程原理, python语法等
五道多选题
1. 数据分类标准
2. 数仓的一致性校验等
五道简答题
1.sql两道
3. spark数据倾斜
4.数据在数仓的生命周期,如何实现
5. 数据质量如何实现,具体说明
值得一提的是使用在线牛客网面试,限时
全部评论
相关推荐
点赞 评论 收藏
分享
06-24 00:02
北京电子科技职业学院 活动运营 点赞 评论 收藏
分享