06-SparkSQL_spark sql创建schema-CSDN博客

网站介绍:文章浏览阅读3k次。1.spark sql1.1.spark sql概述官网地址:http://spark.apache.org/sql/1.1.1.什么是spark sqlspark sql是spark用来处理结构化数据的一个模块,它提供了一个编程抽象DataFrame,作为分布式SQL查询的引擎,它是将spark sql转换成RDD,然后提交到集群中去运行,执行效率非常快。支持多种使用方式:SQL、DataFrame API、DataSet API。相比于spark RDD API,spark sql包含了对结_spark sql创建schema