前言此题是2025年10月携程最新的数据开发面试题,我查阅了一下《大数据开发面试笔记V7.0》,确实是没有!但是回答本题又有一定的难度,于是今天来给大家解析一下本题,并且会补充在面试笔记中(位于spark补充题第29题)参考答案非等值连接不是广播JOIN,而是广播嵌套循环JOIN,也叫 BroadcastNestedLoopJoin,虽然也会将小表广播到所有的executor上,不同于BroadcastHashJoin的是,在JOIN时会用大表的key在未排序的小表中进行逐一匹配,效率非常低下示例说明 spark.sql( """ |select 1 as id,...