数开面经
#找实习# #面经# #数据人offer决赛圈怎么选#
投的太多忘了什么公司了,打电话约面,面的时候发现偏推荐系统的业务,
1.自我介绍
2.项目太简单了,不太对口,面试官好像不太清楚数仓建模?问了点基础八股
3.HDFS的组成架构
4.HDFS读数据的流程
5.MapReduce的执行流程
6.spark的执行流程
7.sparkSQL中map和flatmap的区别
8.hive数据倾斜
9.hive内部表外部表区别
10.小文件处理
11.flume结构
12.flume丢失数据如何处理
13.推荐算法做过吗,机器学习这类(在学校学过,做的不太多,分类回归预测这些)
14. Hive和传统数据库区别(应该是HDFS作为存储数据库)
15. HDFS副本机制
16.spark on yarn和spark standalone区别
17.Python和Java哪个用的多,用来做什么
后面一直在问数据挖掘相关问题,感觉不是很对口,面试官说会反馈我这个情况,数据挖掘倒是也做过,和想找方向不是很统一。
投的太多忘了什么公司了,打电话约面,面的时候发现偏推荐系统的业务,
1.自我介绍
2.项目太简单了,不太对口,面试官好像不太清楚数仓建模?问了点基础八股
3.HDFS的组成架构
4.HDFS读数据的流程
5.MapReduce的执行流程
6.spark的执行流程
7.sparkSQL中map和flatmap的区别
8.hive数据倾斜
9.hive内部表外部表区别
10.小文件处理
11.flume结构
12.flume丢失数据如何处理
13.推荐算法做过吗,机器学习这类(在学校学过,做的不太多,分类回归预测这些)
14. Hive和传统数据库区别(应该是HDFS作为存储数据库)
15. HDFS副本机制
16.spark on yarn和spark standalone区别
17.Python和Java哪个用的多,用来做什么
后面一直在问数据挖掘相关问题,感觉不是很对口,面试官说会反馈我这个情况,数据挖掘倒是也做过,和想找方向不是很统一。
全部评论
mark基础八股题
相关推荐
昨天 19:45
门头沟学院 Java 点赞 评论 收藏
分享
06-12 17:08
天津理工大学 Java 点赞 评论 收藏
分享