投的太多忘了什么公司了,打电话约面,面的时候发现偏推荐系统的业务,1.自我介绍2.项目太简单了,不太对口,面试官好像不太清楚数仓建模?问了点基础八股3.HDFS的组成架构4.HDFS读数据的流程5.MapReduce的执行流程6.spark的执行流程7.sparkSQL中map和flatmap的区别8.hive数据倾斜9.hive内部表外部表区别10.小文件处理11.flume结构12.flume丢失数据如何处理13.推荐算法做过吗,机器学习这类(在学校学过,做的不太多,分类回归预测这些)14. Hive和传统数据库区别(应该是HDFS作为存储数据库)15. HDFS副本机制16.spark on yarn和spark standalone区别17.Python和Java哪个用的多,用来做什么后面一直在问数据挖掘相关问题,感觉不是很对口,面试官说会反馈我这个情况,数据挖掘倒是也做过,和想找方向不是很统一。