核心概念在介绍集群模式前,先来再回顾一下spark中的几个核心概念。driverdirver是spa

Spark任务提交专业术语术语含义application基于用户编写的spark程序。cluster

Spark可以接入多种数据源,常见的有:多格式的文本文件、数据库。下面主要介绍一下有哪几种方式来加载

SparkSQL是Spark的一个模块,它主要用来处理结构化数据。它是相对于SparkCore更高层

概述spark提供了一个抽象的数据集:弹性分布式数据集(RDD)。这是一个多集群数据集合,意味着它可