前几天投的简历,然后今天去面试。因为知识点还没好好的捋一捋,其实犹豫要不要去面试的。emmmm,确实,很die,面试过程很尴尬,感觉一直是大眼瞪小眼,哈哈哈哈哈,凉凉了,就分享一下部分记得的面试题 1、RDD的特点,怎么存储数据? 2、spark的rdd和partition的联系。 3、RDD的算子了解吗?讲讲foreach算子 4、shuffle操作的理解?(应该是问那些算子会触发shuffle操作之类吧) 5、spark 和 mapreduce 区别 6、HDFS的架构,它们分别具备什么功能? 7、nam...