首页 > 文章列表 > 为何在计数统计时,笛卡尔积有时反而比左连接效率更高?

为何在计数统计时,笛卡尔积有时反而比左连接效率更高?

397 2024-11-13

为何在计数统计时,笛卡尔积有时反而比左连接效率更高?

为何笛卡尔积在计数统计时胜过左连接?

在某些场景下,进行计数统计时,使用笛卡尔积(cross join)的效率竟然高于左连接(left join),这似乎违背了常理。

案例对比

以两个表x和y为例,x表有30万行数据,y表有2000行数据。测试结果如下:

左连接

select count(*) from x a left join y b on a.verify_user_id=b.user_id where a.state='2'

笛卡尔积

select count(*) from X A, Y B where A.verify_user_id=B.user_id and A.state='2'

效率对比

  • 左连接:执行时间2.4秒
  • 笛卡尔积:执行时间0.6秒

分析原因

笛卡尔积效率更高的原因在于:

  • 优化器选择差异:左连接指定了x表为主表,导致x表上的索引无法有效地被使用。而笛卡尔积没有指定主表,优化器可以选择数据量更小的y表作为基础表。
  • 查询条件影响:左连接中加入了额外的条件a.state='2', 这会导致对x表的额外扫描。而笛卡尔积中将该条件作为where条件,在读取数据前进行过滤,减少了扫描范围。

需要注意的是,在不同场景下,效率会受到多种因素的影响,具体情况应具体分析。

内连接的优势

专家建议优先使用内连接(inner join),原因如下:

  • 效率更高:内连接实际上是笛卡尔积之后再进行过滤,因此效率会高于左连接。
  • 避免空值:内连接不会产生空值,这在某些情况下非常有用。

因此,在进行计数统计时,应根据实际情况,综合考虑数据量、索引和查询条件等因素,选择合适的join方式。

来源:1729867834