腾讯数仓面经
技术
(1)你们数仓用什么建模方法,说出常见的建模方法?
(2)维度建模有什么好处?为什么选择这个?比如最后业务需求要增加一个维度,我们需要做什么工作?
(3)怎么判断一个需求能不能实现,你们的判断标准是什么?需求变更要做什么
(4)增加一个维度后发现查询的速度变得非常慢:是什么原因导致的?
(5)你们ADS层的数据量每天的数据量有多大?ADS层再MySQL中的表是怎么创建的?有什么注意事项?索引怎么创建的?
(6)你知道Spark的宽窄依赖吗?有没有把宽依赖转化为窄依赖的例子?
(7)Spark参数调优做了些什么?
算法
(1)-个1ist[1,5,5,7,9]去重,并计算时间空间复杂度
(2)单链表的反转
(1)你们数仓用什么建模方法,说出常见的建模方法?
(2)维度建模有什么好处?为什么选择这个?比如最后业务需求要增加一个维度,我们需要做什么工作?
(3)怎么判断一个需求能不能实现,你们的判断标准是什么?需求变更要做什么
(4)增加一个维度后发现查询的速度变得非常慢:是什么原因导致的?
(5)你们ADS层的数据量每天的数据量有多大?ADS层再MySQL中的表是怎么创建的?有什么注意事项?索引怎么创建的?
(6)你知道Spark的宽窄依赖吗?有没有把宽依赖转化为窄依赖的例子?
(7)Spark参数调优做了些什么?
算法
(1)-个1ist[1,5,5,7,9]去重,并计算时间空间复杂度
(2)单链表的反转
全部评论
相关推荐
昨天 15:24
长春工业大学 数据分析师 点赞 评论 收藏
分享
顺丰集团工作强度 290人发布
查看17道真题和解析