网友收藏 文章浏览阅读2.6k次,点赞6次,收藏10次。案例一:分析tomcat的访问日志,求访问量最高的两个网页 1、对每个jps的访问量求和 2、排序 3、取前两条记录 结果:ArrayBuffer((oracle.jsp,9), (hadoop.jsp,9))案例二:分析tomcat的访问日志,根据......
2024-01-23 01:13 阅读
阅读全文 网友收藏 文章浏览阅读2.6k次,点赞6次,收藏10次。案例一:分析tomcat的访问日志,求访问量最高的两个网页 1、对每个jps的访问量求和 2、排序 3、取前两条记录 结果:ArrayBuffer((oracle.jsp,9), (hadoop.jsp,9))案例二:分析tomcat的访问日志,根据......
2024-01-23 01:13 阅读
阅读全文 网友收藏 文章浏览阅读187次。1_利用scala的rdd分组求topn是大数据领域常见的需求,主要是根据数据的某一列进行分...
2024-01-21 11:40 阅读
阅读全文 网友收藏 文章浏览阅读381次。项目需求:需求:使用netcat工具向9999端口不断的发送数据,通过SparkStreaming读取端口数据并统计不同单词出现的次数。代码实现:def main(args: Array[String]): Unit = { //创建配置对象文件 val conf: SparkConf = new Spa......
2024-01-23 07:23 阅读
阅读全文 网友收藏 文章浏览阅读1.2k次。大数据spark 蘑菇云行动前传第1课:大数据时代的黄金语言scala1 jvm的企业级霸主地位和今日java2 黄金语言scala3 scala在大数据中的黄金地位_scala语言在大数据、人工智能等的应用案例...
2024-01-23 08:29 阅读
阅读全文 网友收藏 文章浏览阅读251次。1.需求:在给定的订单数据,根据订单的分类ID进行聚合,然后按照订单分类名称,统计出某一天商品各个分类的成交金额,然后在结合商品分类表匹配上对应的商品分类字段,然后将计算结果保存到mysql中,要求......
2024-01-22 15:52 阅读
阅读全文 网友收藏 文章浏览阅读445次。目标需求:根据网站访问日志的到访问量最高的页面数据格式:import org.apache.spark.{SparkConf, SparkContext}//需求:根据网站访问日志的到访问量最高的页面object MyWebLogCount { def main(args: Array[String]): Unit = { //开......
2024-01-23 11:20 阅读
阅读全文 网友收藏 大数据技术之_16_Scala学习_11_客户信息管理系统+并发编程模型 Akka+Akka 网络编程-小黄鸡客服案例+Akka 网络编程-Spark Master Worker 进程通讯项目_scala黑窗口出现y/n...
2023-10-10 03:26 阅读
阅读全文