Apache Pig RANDOM()函数
RANDOM() 函数用于获取大于或等于0.0且小于1.0的伪随机数(double类型)。
grunt> RANDOM()
例
假设在 HDFS 目录 /pig_data/ 中有一个名为 math.txt 的文件。此文件包含整数和浮点值,如下所示。
math.txt
5 16 9 2.5 5.9 3.1
通过使用 math_data 关系将此文件加载到Pig中,如下所示。
grunt> math_data = LOAD 'hdfs://localhost:9000/pig_data/math.txt' USING PigStorage(',') as (data:float);
现在使用 RANDOM() 函数生成math.txt文件内容的随机值,如下所示。
grunt> random_data = foreach math_data generate (data), RANDOM();
上述语句结果将存储在名为 random_data 的关系中。使用Dump运算符验证关系的内容,如下所示。
grunt> Dump random_data; (5.0,0.6842057767279982) (16.0,0.9725172591786139) (9.0,0.4159326414649489) (2.5,0.30962777780713147) (5.9,0.705213727551145) (3.1,0.24247708413861724)