Apache Spark 教程
Apache Spark 教程
Apache的Spark是一个闪电般快速的集群计算设计的快速计算。它是建立在Hadoop的MapReduce之上,它扩展了MapReduce的模型,以有效地使用更多类型的计算,其中包括交互式查询和流处理。这是一个简短的教程,说明Spark核心编程的基础知识。
听众
本教程为专业人士使用抱负Spark框架来学习大数据分析的基础,并成为Spark开发者编写的。此外,这将是分析专业人士和ETL开发人员有用的。
先决条件
在开始使用此教程开始之前,我们假设你有事先接触到Scala编程,数据库的概念,任何Linux操作系统的味道。