网站介绍:文章浏览阅读1.7k次。第65课:SparkSQL下Parquet深入进阶本期内容:1 SparkSQL下的Parquet序列化2 SparkSQL下的Parquet源码解读3 SparkSQL下Parquet总结 Parquet中关键概念:1 Block2 File3 Column Chunk数据按列存储时,每一列的数据被分割成多个列块。存储逻辑视图:RowGroup_spark sql写parquet文件怎么定义rowgroup
- 链接地址:https://blog.csdn.net/slq1023/article/details/51051592
- 链接标题:第65课:SparkSQL下Parquet深入进阶学习笔记_spark sql写parquet文件怎么定义rowgroup-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:6800
- 网站标签:spark sql写parquet文件怎么定义rowgroup