第65课:SparkSQL下Parquet深入进阶学习笔记_spark sql写parquet文件怎么定义rowgroup-CSDN博客

网站介绍:文章浏览阅读1.7k次。第65课:SparkSQL下Parquet深入进阶本期内容:1 SparkSQL下的Parquet序列化2 SparkSQL下的Parquet源码解读3 SparkSQL下Parquet总结 Parquet中关键概念:1 Block2 File3 Column Chunk数据按列存储时,每一列的数据被分割成多个列块。存储逻辑视图:RowGroup_spark sql写parquet文件怎么定义rowgroup