Spark SQL 架构概述 架构核心组件 API层(用户接口) 输入方式: SQL查询;DataFrame/Dataset API。 统一性: 所有接口最终转换为逻辑计划树(Logical Plan),进入优化流程。 编译器层(Catalyst 优化器) 核心引擎: 基于规则的优化器(Rule-Based Optimizer, RBO)与成本优化器(Cost-Based Optimizer, CBO)。 处理流程: 阶段 输入 输出 关键动作 解析 SQL/API 操作 未解析逻辑计划 构建语法树(AST),校验语法正确性 分析 未解析逻辑计划 解析后逻...