Spark可以接入多种数据源,常见的有:多格式的文本文件、数据库。下面主要介绍一下有哪几种方式来加载

SparkSQL是Spark的一个模块,它主要用来处理结构化数据。它是相对于SparkCore更高层

概述spark提供了一个抽象的数据集:弹性分布式数据集(RDD)。这是一个多集群数据集合,意味着它可