OceanBase MERGE

MERGE 算子用于将源表中的数据行以更新或插入的方式合并到目标表中。

OceanBase 数据库支持的 MERGE 算子包括 MERGE 和 MULTI PARTITION MERGE。

MERGE

MERGE 算子用于合并数据表单个分区中的数据。

如下例所示，Q1 查询将 src_tbl 表中的数据行合并到 t1 表中，对于 src_tbl 中的每一条数据行按照如下方式进行合并：

当 t1 中存在满足 t1.c1=src_tbl.c1 条件的数据行：

如果满足 src_tbl.c2 > '100'，则执行更新操作，将 t1.c2 的值置为 src_tbl.c2 的值（目标表中的每一行只会更新一次）。
如果不满足 src_tbl.c2 > '100'，则不执行更新操作。

当 t1 中不存在满足 t1.c1 = src_tbl.c1 条件的数据行：

如果满足 src_tbl.c1 > 10，则执行插入操作，向 t1 中插入 (src_tbl.c1,src_tbl.c2)。
如果不满足 src_tbl.c1 > 10，则不指定插入操作。

obclient>CREATE TABLE src_tbl (c1 INT PRIMARY KEY, c2 VARCHAR2(10));
Query OK, 0 rows affected (0.12 sec)

obclient>CREATE TABLE t1 (c1 INT PRIMARY KEY, c2 VARCHAR2(10));
Query OK, 0 rows affected (0.12 sec)

obclient>CREATE TABLE t2 (c1 INT PRIMARY KEY, c2 VARCHAR2(10)) PARTITION BY HASH(c1) 
         PARTITIONS 10;
Query OK, 0 rows affected (0.12 sec)

Q1: 
obclient>EXPLAIN MERGE INTO t1 USING src_tbl ON (t1.c1 = src_tbl.c1)
        WHEN MATCHED THEN 
        UPDATE SET t1.c2 = src_tbl.c2 WHERE src_tbl.c2 > '100'
        WHEN NOT MATCHED THEN 
        INSERT (t1.c1, t1.c2)  VALUES (src_tbl.c1,src_tbl.c2) WHERE src_tbl.c1 > 10\G;
*************************** 1. row ***************************
Query Plan:
===============================================
|ID|OPERATOR         |NAME   |EST. ROWS|COST  |
-----------------------------------------------
|0 |MERGE            |       |100001   |100001|
|1 | MERGE OUTER JOIN|       |100001   |219005|
|2 |  TABLE SCAN     |SRC_TBL|100000   |61860 |
|3 |  TABLE SCAN     |T1     |100000   |61860 |
===============================================

Outputs & filters:
-------------------------------------
  0 - output([column_conv(DECIMAL,PS:(38,0),NOT NULL,SRC_TBL.C1)], [column_conv(VARCHAR,utf8mb4_bin,length:10,NULL,SRC_TBL.C2)]), filter(nil),
      columns([{T1: ({T1: (T1.C1, T1.C2)})}]), partitions(p0),
      update([T1.C2=column_conv(VARCHAR,utf8mb4_bin,length:10,NULL,SRC_TBL.C2)]),
      match_conds([T1.C1 = SRC_TBL.C1]), insert_conds([SRC_TBL.C1 > 10]),
      update_conds([SRC_TBL.C2 > '100']), delete_conds(nil)
  1 - output([SRC_TBL.C1], [SRC_TBL.C2], [T1.C1], [T1.C1 = SRC_TBL.C1], [T1.C2]), filter(nil),
      equal_conds([T1.C1 = SRC_TBL.C1]), other_conds(nil)
  2 - output([SRC_TBL.C1], [SRC_TBL.C2]), filter(nil),
      access([SRC_TBL.C1], [SRC_TBL.C2]), partitions(p0)
  3 - output([T1.C1], [T1.C2]), filter(nil),
      access([T1.C1], [T1.C2]), partitions(p0)

其中，OUTER JOIN 是合并功能实现时依赖的一次联接操作，使用 MERGE 算子时，一定会在 source_table 和 target_table 上做一次外联接，目的是为了区分哪些行是匹配的，哪些是不匹配的。

执行计划展示中的 outputs & filters 详细列出了 MERGE 算子的输出信息如下：

信息名称	含义
output	该算子输出的表达式。
filter	该算子上的过滤条件。由于示例中 MERGE 算子没有设置 filter，所以为 nil。
columns	插入操作涉及的数据表的列。
partitions	插入操作涉及到的数据表的分区。
update	更新操作中所有的赋值表达式。
match_conds	源表和目标表进行匹配的条件。
insert_conds	插入操作需要满足的条件。
update_conds	更新操作需要满足的条件。
delete_conds	删除操作需要满足的条件。

MULTI PARTITION MERGE

MULTI PARTITION MERGE 算子用于合并数据表多个分区中的数据。

如下例所示，Q2 查询将 src_tbl 表中的数据行合并到分区表 t2 表中，对于 src_tbl 中的每一条数据行按照如下方式进行合并：

当 t2 中存在满足 t2.c1 = src_tbl.c1 条件的数据行：

执行更新操作，将 t2.c2 的值置为 substr(src_tbl.c2, 1, 5) 的值（目标表中的每一行只会更新一次）。
更新完成后，如果满足 t2.c2 > '80000' ，则删除对应的数据行。

当 t2 中不存在满足 t2.c1 = src_tbl.c1 条件的数据行，执行插入操作，向 t2 中插入 (src_tbl.c1, src_tbl.c2)。

Q2: 
obclient>EXPLAIN MERGE INTO t2 USING SRC_TBL ON (t2.c1 = src_tbl.c1)
        WHEN MATCHED THEN 
        UPDATE SET t2.c2 = SUBSTR(src_tbl.c2, 1, 5) 
        DELETE WHERE t2.c2 > '80000'
        WHEN NOT MATCHED THEN 
        INSERT (t2.c1, t2.c2) VALUES (src_tbl.c1,src_tbl.c2)\G;
*************************** 1. row ***************************
Query Plan:
============================================================

|ID|OPERATOR                      |NAME    |EST. ROWS|COST   |
--------------------------------------------------------------
|0 |MULTI PARTITION MERGE         |        |100000   |100000 |
|1 | PX COORDINATOR               |        |100000   |956685 |
|2 |  EXCHANGE OUT DISTR          |:EX10001|100000   |899889 |
|3 |   MERGE OUTER JOIN           |        |100000   |899889 |
|4 |    EXCHANGE IN DISTR         |        |100000   |90258  |
|5 |     EXCHANGE OUT DISTR (PKEY)|:EX10000|100000   |61860  |
|6 |      TABLE SCAN              |SRC_TBL |100000   |61860  |
|7 |    SORT                      |        |1000000  |5447108|
|8 |     PX PARTITION ITERATOR    |        |1000000  |618524 |
|9 |      TABLE SCAN              |T2      |1000000  |618524 |
==============================================================

Outputs & filters:
-------------------------------------
  0 - output([column_conv(DECIMAL,PS:(38,0),NOT NULL,SRC_TBL.C1)], [column_conv(VARCHAR,utf8mb4_bin,length:10,NULL,SRC_TBL.C2)]), filter(nil),
      columns([{T2: ({T2: (T2.C1, T2.C2)})}]), partitions(p[0-9]),
      update([T2.C2=column_conv(VARCHAR,utf8mb4_bin,length:10,NULL,SUBSTR(SRC_TBL.C2, 1, 5))]),
      match_conds([T2.C1 = SRC_TBL.C1]), insert_conds(nil),
      update_conds(nil), delete_conds([T2.C2 > '80000'])
  1 - output([SRC_TBL.C1], [SRC_TBL.C2], [T2.C1], [T2.C1 = SRC_TBL.C1], [T2.C2]), filter(nil)
  2 - output([SRC_TBL.C1], [SRC_TBL.C2], [T2.C1], [T2.C1 = SRC_TBL.C1], [T2.C2]), filter(nil), dop=1
  3 - output([SRC_TBL.C1], [SRC_TBL.C2], [T2.C1], [T2.C1 = SRC_TBL.C1], [T2.C2]), filter(nil),
      equal_conds([T2.C1 = SRC_TBL.C1]), other_conds(nil)
  4 - output([SRC_TBL.C1], [SRC_TBL.C2]), filter(nil)
  5 - (#keys=1, [SRC_TBL.C1]), output([SRC_TBL.C1], [SRC_TBL.C2]), filter(nil), is_single, dop=1
  6 - output([SRC_TBL.C1], [SRC_TBL.C2]), filter(nil),
      access([SRC_TBL.C1], [SRC_TBL.C2]), partitions(p0)
  7 - output([T2.C1], [T2.C2]), filter(nil), sort_keys([T2.C1, ASC]), local merge sort
  8 - output([T2.C1], [T2.C2]), filter(nil)
  9 - output([T2.C1], [T2.C2]), filter(nil),
      access([T2.C1], [T2.C2]), partitions(p[0-9])

上述示例的执行计划展示中的 outputs & filters 详细列出了 MULTI PARTITION MERGE 算子的输出信息，字段的含义与 MERGE 算子相同。

w3cschool 编程狮，随时随地学编程

OceanBase MERGE

MERGE

MULTI PARTITION MERGE

OceanBase 产品简介

OceanBase 快速入门

OceanBase 教程

OceanBase 控制台指南

OceanBase 集群工作台

OceanBase 租户

OceanBase 监控

OceanBase 诊断

OceanBase 备份恢复管理

OceanBase 安全设置

OceanBase 参数管理

OceanBase 数据传输

OceanBase 产品简介

OceanBase 产品架构

OceanBase 产品功能

OceanBase 快速入门

OceanBase 迁移项目管理

OceanBase MySQL数据库迁移

OceanBase Oracle数据库迁移

OceanBase 常见问题

OceanBase ODC 使用指南

OceanBase Web 版 ODC

OceanBase 连接数据库

OceanBase 使用工作台

OceanBase 使用工具

OceanBase 数据导出和导入

OceanBase 任务管理

OceanBase 数据库对象

OceanBase 表对象

OceanBase 视图对象

OceanBase 函数对象

OceanBase 存储过程对象

OceanBase 序列对象

OceanBase 程序包对象

OceanBase 触发器对象

OceanBase 类型对象

OceanBase 同义词对象

OceanBase 客户端版 ODC

OceanBase 连接数据库

OceanBase 使用工作台

OceanBase 使用工具

OceanBase 数据导出和导入

OceanBase 任务管理

OceanBase 数据库对象

OceanBase 表对象

OceanBase 视图对象

OceanBase 函数对象

OceanBase 存储过程对象

OceanBase 序列对象

OceanBase 程序包对象

OceanBase 触发器对象

OceanBase 类型对象

OceanBase 同义词对象

OceanBase Connector/J 开发者指南

OceanBase 什么是OceanBase Connector/J

OceanBase Connector/J 使用指南

OceanBase 基本操作

OceanBase Java数据流

OceanBase 使用LOB

OceanBase 数据源和URL

OceanBase 结果集

OceanBase 语句缓存

OceanBase 参考信息

OceanBase Oracle 模式特有功能

OceanBase 分布式事务

OceanBase SQL 参考（MySQL 模式）

OceanBase 基本元素

OceanBase 数据类型

OceanBase 运算符

OceanBase 函数

OceanBase 单行函数

OceanBase 查询和子查询

OceanBase SQL语句

OceanBase SQL 参考（Oracle 模式）

OceanBase 基本元素

OceanBase 内建数据类型