文章浏览阅读1.2w次,点赞24次,收藏192次。本项目为大数据电商数仓分析项目,项目目前具体分为两大部分,第一部分:模拟常规电商数仓分析流程,利用hadoop相关生态mapreduce、spark等进行数据清洗,再通过hive、spark统计对用户......
2024-01-12 19:54 阅读 阅读全文文章浏览阅读1w次,点赞20次,收藏159次。数仓建设流程一、数仓概览二、流程详解1.梳理业务流程2.垂直切分,划分主题域3.梳理指标体系4.表实体关系调研5.维度梳理4.数仓分层7.物理模型建立三、tipis注:本文转至 如何搭建一个......
2024-01-22 22:50 阅读 阅读全文文章浏览阅读1w次,点赞20次,收藏159次。数仓建设流程一、数仓概览二、流程详解1.梳理业务流程2.垂直切分,划分主题域3.梳理指标体系4.表实体关系调研5.维度梳理4.数仓分层7.物理模型建立三、tipis注:本文转至 如何搭建一个......
2024-01-22 22:50 阅读 阅读全文贝壳苏州租房网,提供真实的苏州九龙仓碧堤雅苑租房信息、出租房源信息、租房价格,包括苏州九龙仓碧堤雅苑整租、合租、公寓出租等信息,以及苏州九龙仓碧堤雅苑房屋出租个人信息、经纪人信息、品牌公寓信息等.找租房房......
2024-03-02 07:25 阅读 阅读全文文章浏览阅读2.1k次,点赞4次,收藏36次。电商数仓项目(一)一.数据仓库概念1.业务数据就是各行业在处理事务过程中产生的数据。2.用户行为数据用户在使用产品过程中,与客户端产品交互过程中产生的数据。3.数据仓库为企业......
2024-01-12 19:54 阅读 阅读全文文章浏览阅读3k次,点赞7次,收藏18次。前言 维度缓慢变化为SCD(Slowly Changing Dimensions)一些维度表的数据不是静态的,而是会随着时间而缓慢地变化(这里的缓慢是相对事实表而言,事实表数据变化的速度比维度表快,......
2024-01-23 11:05 阅读 阅读全文文章浏览阅读3k次,点赞7次,收藏18次。前言 维度缓慢变化为SCD(Slowly Changing Dimensions)一些维度表的数据不是静态的,而是会随着时间而缓慢地变化(这里的缓慢是相对事实表而言,事实表数据变化的速度比维度表快,......
2024-01-23 11:07 阅读 阅读全文文章浏览阅读500次。1 埋点数据基本格式公共字段:基本所有手机都包含的字段 业务字段:埋点上报字段,有具体的业务类型ps:一般使用json格式json格式示例:{"ap":"xxxxx",//产品字段 app key"cm":{ //公共字段 ......
2024-01-12 19:52 阅读 阅读全文文章浏览阅读727次。1.为什么做电商数仓 数据越来越多,我们把各部门的数据收集到一起,通过分析,计算等转化成对我们公司有价值的数据,为我们公司做决策提供一个数据支持.2.技术架构 日志数据:我们通过flume采集埋点的日......
2024-01-12 19:50 阅读 阅读全文数仓白菜白擅长hive基础,Spark SQL,Scala,等方面的知识...
2024-01-22 14:38 阅读 阅读全文