90% 的数据分析师忽略了这个 SQL 概念

大多数人都是通过网课教程、训练营或在工作中实践来学习 SQL，那你是否有问过“数据库实际上是如何执行这个查询的?"

如果没有的话，也不用担心，因为这就是 90% 的分析师都会忽略的概念——查询执行策略。

SQL的背后，是查询规划器和执行引擎在做决策。如果你不了解 SQL 的幕后运行机制，你的查询可能会变得更慢，也更难扩展。

举个例子，两个查询做同样的事情，你试试看是不是其中一个查询的运行速度更快？

方式一：

SELECT customer_id,

(SELECT COUNT(*)

FROM orders o

WHERE o.customer_id = c.customer_id) AS total_orders

FROM customers c;

方式二：

SELECT c.customer_id, COUNT(o.order_id) AS total_orders

FROM customers c

LEFT JOIN orders o ON o.customer_id = c.customer_id

GROUP BY c.customer_id;

方法一更慢，因为它使用的是子查询，会对表中的每一行都运行一次检查，而第二个方式则是使用了数据库的优化链接，一次性完成数据聚合。

SQL 不仅仅是获得正确的结果，任何人都可以编写有效的查询，但只有优秀的分析师才能编写高效、可扩展且可读的查询。一旦你了解了执行引擎的工作原理，就会开始发现自己代码中以前从未注意到的错误。

以下是几个经验教训：

避免对大表使用相关子查询，尽可能使用 JOIN 或 CTE 。
如果查询花费的时间超过 3 秒，请查看执行计划，寻找嵌套循环（不适合大型连接）& 表扫描（可以通过索引进行优化）
像迷你 DBA 一样理解索引，检查缺失的索引，了解集群与非集群，优化索引列的 WHERE 子句
SQL 不仅仅与输出有关，它还与可维护性有关，注意清晰表达，合理使用别名，注释复杂的逻辑。

---

我是钱德勒（chandler_is_dreaming），拥有超10年全球顶尖企业数据运营与商业分析实战经验，曾任职于多家头部互联网及国际知名企业，历任商业运营总监、商业智能负责人、数据分析高级经理等职。具备丰富的数据分析实战经验，曾成功从0搭建团队、优化流程、推动数字化转型，最多管理60余人的数据团队，累计面试超300人，尤其擅长数据相关岗位（如数据分析师、商业分析师、运营分析师、数据产品经理等）的职业规划、简历优化、技能提升、业务思维、面试技巧等。

数据分析+数据科学+商业运营文章被收录于专栏

钱德勒，拥有超10年全球顶尖企业数据运营与商业分析实战经验，曾任职于Amazon等国际头部企业，历任商业运营总监、商业智能负责人、数据分析高级经理等职。具备丰富的数据分析实战经验，曾成功从0搭建团队、优化流程、推动数字化转型，管理60余人的数据团队，累计面试超300人，尤其擅长数据相关岗位（如数据分析师、商业分析师、运营分析师、数据产品经理等）的职业规划、简历优化、技能提升、业务思维、面试技巧等。