Apache Pig TextLoader()函数
Pig Latin函数 TextLoader() 是一个Load函数,用于以UTF-8格式加载非结构化数据。
语法
下面给出了 TextLoader() 函数的语法。
grunt> TextLoader()
例
假设在名为 /data/ 的HDFS目录中有一个名为 stu_data.txt 的文件,如下所示。
001,Rajiv_Reddy,21,Hyderabad 002,siddarth_Battacharya,22,Kolkata 003,Rajesh_Khanna,22,Delhi 004,Preethi_Agarwal,21,Pune 005,Trupthi_Mohanthy,23,Bhuwaneshwar 006,Archana_Mishra,23,Chennai 007,Komal_Nayak,24,trivendram 008,Bharathi_Nambiayar,24,Chennai
现在让我们使用 TextLoader() 函数加载上述文件。
grunt> details = LOAD 'hdfs://localhost:9000/pig_data/stu_data.txt' USING TextLoader();
你可以使用Dump运算符验证加载的数据。
grunt> dump details; (001,Rajiv_Reddy,21,Hyderabad) (002,siddarth_Battacharya,22,Kolkata) (003,Rajesh_Khanna,22,Delhi) (004,Preethi_Agarwal,21,Pune) (005,Trupthi_Mohanthy,23,Bhuwaneshwar) (006,Archana_Mishra,23,Chennai) (007,Komal_Nayak,24,trivendram) (008,Bharathi_Nambiayar,24,Chennai)