pyspark sparksession_PySpark工作原理-CSDN博客

网站介绍:文章浏览阅读705次。原文作者:李海强,来自平安银行零售大数据团队前言Spark是一个开源的通用分布式计算框架,支持海量离线数据处理、实时计算、机器学习、图计算,结合大数据场景,在各个领域都有广泛的应用。Spark支持多种开发语言,包括Python、Java、Scala、R,上手容易。其中,Python因为入门简单、开发效率高(人生苦短,我用Python),广受大数据工程师喜欢,本文主要探讨Pyspark的工..._pyspark pyspark_utils.get_sparksession