文章浏览阅读3.2k次,点赞2次,收藏46次。电商数据仓库系统6. 数仓搭建-DWD层启动日志表–对应一个启动日志页面日志表–对应一个页面埋点日志动作日志表–在一个页面埋点日志会有多个动作一行数据是一个动作,所以就需要......
2024-01-22 17:48 阅读 阅读全文DataX简介(3.0版本),数仓架构(离线和实时)--企业版,数据仓库,大数据,cloudera...
2024-01-23 19:04 阅读 阅读全文数据仓库笔记,日常用到的spark调优,数据仓库...
2024-01-23 20:02 阅读 阅读全文数仓相关思考5,Hive常用日期处理函数,数仓之常用业务术语,数据仓库,大数据...
2024-01-23 12:31 阅读 阅读全文聊聊数据公司团队对数仓的规范都做什么事,数据仓库...
2024-01-23 22:35 阅读 阅读全文数据仓库理论,数据仓库应用场景,数据仓库分层及模型设计,数据仓库,大数据...
2024-01-23 22:27 阅读 阅读全文文章浏览阅读1.7k次,点赞4次,收藏52次。【尚硅谷】电商数仓V4.0丨大数据数据仓库项目实战【学习记录】思考问题?1. 为什么用hive on spark来处理数据?1. 数据仓库概念1.1 原始数据备份到ODS中1.2 DWD完成数据的清洗1.3 join形成大......
2024-01-22 17:48 阅读 阅读全文数仓理论之关系建模与维度建模,数仓理论之范式理论,数仓理论之同步策略,数仓 大数据...
2024-01-24 00:25 阅读 阅读全文文章浏览阅读352次。默认队列defaultYarn默认调度器为Capacity Scheduler(容量调度器),且默认只有一个队列——default。如果队列中执行第一个任务资源不够,就不会再执行第二个任务,一直等到第一个任务执行完毕。解决办法一:......
2024-01-23 08:52 阅读 阅读全文Hive的metastore和hiveserver2,Sqoop同步策略,项目经验之Flume内存优化,hadoop,mapreduce,大数据...
2024-01-23 09:43 阅读 阅读全文