OceanBase CUME_DIST
CUME_DIST
计算一个值在一组值中的累积分布。返回值的范围为 0 < CUME_DIST <= 1
。领带值总是评估到相同的累积分布值。此函数将可以隐式转换为数字数据类型的任何数字数据类型或任何非数字数据类型作为参数。OceanBase 数据库确定具有最高数值优先级的参数,隐式地将其余参数转换为该数据类型,进行计算并返回 NUMBER
。
作为一个分析函数,CUME_DIST
计算指定值在一组值中的相对位置。 对于行 r,假设升序,r 的 cume_dist 是值低于或等于 r 值的行数除以被计算的行数(整个查询结果集或分区)。
语法
CUME_DIST() OVER ([ query_partition_clause ] order_by_clause)
参数
参数 |
说明 |
---|---|
expr |
|
{RESPECT | IGNORE} NULLS |
表示是否忽略 |
返回类型
返回值为 NUMBER
数据类型。
示例
创建表 emp_msg,并向里面插入数据。执行以下语句:
CREATE TABLE emp_msg(deptno INT, ename varchar(30), sal INT, MGR varchar(30));
INSERT INTO emp_msg VALUES(10,'CLARK', 2750, 7839);
INSERT INTO emp_msg VALUES(10,'KING', 5300, NULL);
INSERT INTO emp_msg VALUES(10,'MILLER', 1600, 7782);
INSERT INTO emp_msg VALUES(20,'ADAMS', 1400, 7788);
INSERT INTO emp_msg VALUES(20,'FORD', 3300, 7566);
INSERT INTO emp_msg VALUES(20,'JONES', 3275, 7839);
INSERT INTO emp_msg VALUES(20,'SCOTT', 3300, 7566);
INSERT INTO emp_msg VALUES(20,'SMITH', 1100, 7902);
INSERT INTO emp_msg VALUES(30,'ALLEN', 1900, 7698);
INSERT INTO emp_msg VALUES(30,'BLAKE', 3150, 7839);
INSERT INTO emp_msg VALUES(30,'JAMES', 1250, 7698);
INSERT INTO emp_msg VALUES(30,'MARTIN', 1550, 7698);
INSERT INTO emp_msg VALUES(30,'TURNER', 1800, 7698);
INSERT INTO emp_msg VALUES(30,'WARD', 1550, 7698);
返回指定列 sal 在同 deptno 中的 CUME_DIST
的值,执行以下语句:
SELECT deptno , ename , sal, cume_dist ( ) over ( partition BY deptno ORDER BY sal DESC ) "RANK"
FROM emp_msg WHERE sal>2000;
查询结果如下:
+--------+-------+------+-------------------------------------------+
| DEPTNO | ENAME | SAL | RANK |
+--------+-------+------+-------------------------------------------+
| 10 | KING | 5300 | .5 |
| 10 | CLARK | 2750 | 1 |
| 20 | FORD | 3300 | .6666666666666666666666666666666666666667 |
| 20 | SCOTT | 3300 | .6666666666666666666666666666666666666667 |
| 20 | JONES | 3275 | 1 |
| 30 | BLAKE | 3150 | 1 |
+--------+-------+------+-------------------------------------------+