一面: 1. 刚开始面试就是对简历项目一顿撕,PV和UV是怎么计算的,UV怎么进行去重的?不用ES该如何实现去重? 这个项目我还准备了下,结果答的还是不太好, 2. 说说flink,spark streaming,storm的区别? 活题,随便答; 3. 3. spark的调度执行逻辑,stage,宽依赖和窄依赖,容错机制? 容错机制: 窄依赖可以通过血缘关系 来恢复故障RDD,而宽依赖则考虑使用 检查点 的方式恢复。 RDD的容错机制是 如何实现的? 1. 借助这些依赖关系,DAG可以认为这些RDD之间形成了 lineage(血统,血缘关系...