Apache Pig Filter运算符

FILTER 运算符用于根据条件从关系中选择所需的元组。

语法

下面给出了 FILTER 运算符的语法。

grunt> Relation2_name = FILTER Relation1_name BY (condition);

例

假设在HDFS目录 /pig_data/ 中有一个名为 student_details.txt 的文件，如下所示。

student_details.txt

001,Rajiv,Reddy,21,9848022337,Hyderabad
002,siddarth,Battacharya,22,9848022338,Kolkata
003,Rajesh,Khanna,22,9848022339,Delhi 
004,Preethi,Agarwal,21,9848022330,Pune 
005,Trupthi,Mohanthy,23,9848022336,Bhuwaneshwar 
006,Archana,Mishra,23,9848022335,Chennai 
007,Komal,Nayak,24,9848022334,trivendram 
008,Bharathi,Nambiayar,24,9848022333,Chennai

将此文件通过关系 student_details 加载到的Pig中，如下所示。

grunt> student_details = LOAD 'hdfs://localhost:9000/pig_data/student_details.txt' USING PigStorage(',')
   as (id:int, firstname:chararray, lastname:chararray, age:int, phone:chararray, city:chararray);

现在使用Filter运算符来获取属于Chennai城市的学生的详细信息。

filter_data = FILTER student_details BY city == 'Chennai';

验证

使用 DUMP 运算符验证关系 filter_data ，如下所示。

grunt> Dump filter_data;

输出

它将产生以下输出，显示关系 filter_data 的内容如下。

(6,Archana,Mishra,23,9848022335,Chennai)
(8,Bharathi,Nambiayar,24,9848022333,Chennai)

w3cschool 编程狮，随时随地学编程

Apache Pig Filter运算符

语法

例

验证

输出

Apache Pig 介绍

Apache Pig 环境

Pig Latin 介绍

Apache Pig 加载和存储

Apache Pig 诊断运算符

Apache Pig 分组和连接

Apache Pig 合并和拆分

Apache Pig 过滤

Apache Pig 排序

Pig Latin 内置函数

Apache Pig 其他执行模式

Apache Pig 有用的资源