《大数据处理技术Spark》--林子雨_spark大数据处理技术课程-CSDN博客

网站介绍:文章浏览阅读1.6k次,点赞3次,收藏9次。hadoop伪分布实例伪分布式读取的则是 HDFS 上的数据。要使用 HDFS,首先需要在 HDFS 中创建用户目录:hdfs dfs -mkdir -p /user/hadoop # 已经将hadoop中的bin加入到环境变量中将本地的word.txt复制到分布式文件系统的/user/hadoop/input中hdfs dfs -mkdir input # 因为现在使用的是hadoo..._spark大数据处理技术课程