淘天数据研发1面

1.介绍一下一到两段实习经历,自己做了什么,遇到了什么问题,对自己比较有挑战的点。
2.项目深入拷打
3.假设两个表主key是非数值数据,而且是万亿join万亿,这个怎么处理?
4.大表join小表?
5.要是mapjoin时,key值是json怎么解决
6.Hive表里的分桶,分桶有哪几种形式,分桶与分区的区别?什么时候要去做分桶?
7.spark调优思路
8.了解的大数据前沿?

一道dp+一道hard
全部评论
大佬第三题有什么思路吗
点赞 回复 分享
发布于 04-05 21:39 上海
兄弟,算法题面试啥,分享下
点赞 回复 分享
发布于 04-04 20:56 上海

相关推荐

3.21 一面自我介绍有一个新的业务,你会怎么做?(数仓建模方式)数仓分层有什么好处介绍一下Spark的join方式(broadcast join, shuffle hash join,sort-merge join)shuffle hash join 和 sort-merge join Spark常用的join是哪个?介绍一下MapReduce的执行过程Hive SQL优化星型模型、雪花模型的区别及应用场景介绍项目,项目分层是如何实现的项目的ods层数据是如何得到的,dws层是如何设计的sql : 1、求在线店铺的月累积销售金额 2、求相邻在线店铺的月累积销售金额的差额sum() ove...
OceanRivers:感觉现在的企业是真抽象,找实习生要求要有实习经历(我要是有实习经历还要来找实习吗),这和校招招应届生的要求有啥区别,按这逻辑以后是不是毕业找工作直接要求一年以上工作经验,也不知道是现在行业卷到这地步了还是企业单纯不想花更多资源培养新人,就想着招有工作经验的牛马,入职直接酷酷工作,然后给他发实习生水平的薪资当廉价劳动力
查看18道真题和解析
点赞 评论 收藏
分享
查看19道真题和解析
点赞 评论 收藏
分享
评论
3
10
分享

创作者周榜

更多
牛客网
牛客企业服务