下载APP 随时随地学编程
返回 首页

Apache Pig教程

开始阅读
手册说明:

Apache Pig教程


Apache Pig是MapReduce的一个抽象,它是一个工具/平台,用于分析较大的数据集,并将它们表示为数据流。Pig通常与Hadoop 一起使用;我们可以使用Pig在Hadoop中执行所有的数据处理操作。

适用人群

本教程面向所有从事Hadoop的专业人员,他们希望执行MapReduce操作,而不必在Java中键入复杂的代码。

学习前提

为了充分掌握本教程,你应该充分了解Hadoop和HDFS命令的基础知识,而如果你善于SQL会更有帮助。


目录

Apache Pig 介绍

Apache Pig 概述
Apache Pig 架构

Apache Pig 环境

Apache Pig 安装
Apache Pig 执行
Apache Pig Grunt Shell

Pig Latin 介绍

Pig Latin 基础

Apache Pig 加载和存储

Apache Pig 加载数据
Apache Pig 存储数据

Apache Pig 诊断运算符

Apache Pig Diagnostic运算符
Apache Pig Describe运算符
Apache Pig Explain运算符
Apache Pig illustrate运算符

Apache Pig 分组和连接

Apache Pig Group运算符
Apache Pig Cogroup运算符
Apache Pig Join运算符
Apache Pig Cross运算符

Apache Pig 合并和拆分

Apache Pig Union运算符
Apache Pig Split运算符

Apache Pig 过滤

Apache Pig Filter运算符
Apache Pig Distinct运算符
Apache Pig Foreach运算符

Apache Pig 排序

Apache Pig Order By运算符
Apache Pig Limit运算符

Pig Latin 内置函数

Apache Pig Eval函数
Apache Pig 加载和存储函数
Apache Pig 包和元组函数
Apache Pig 字符串函数
Apache Pig 日期时间函数
Apache Pig 数学函数

Apache Pig 其他执行模式

Apache Pig 用户定义函数(UDF)
Apache Pig 运行脚本

Apache Pig 有用的资源

Apache Pig 有用资源
Apache Pig 讨论

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }