码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 19 使用MapReduce编程统计超市1月商品被购买的次数


        首先将1月份的订单数据上传到HDFS上,订单数据格式  ID  Goods两个数据字段构成

    将订单数据保存在order.txt中,(上传前记得启动集群)。

    打开Idea创建项目

    修改pom.xml,添加依赖

    
        
            org.apache.hadoop
            hadoop-client
            3.1.4
        
        
            junit
            junit
            4.12
        
        
            org.slf4j
            slf4j-log4j12
            1.7.30
        
    

    指定打包方式:jar

    打包时插件的配置:

    
        
            
                maven-compiler-plugin
                3.1
                
                    1.8
                    1.8
                
            
            
                maven-assembly-plugin
                
                    
                        jar-with-dependencies
                    
                
                
                    
                        make-assembly
                        package
                    
                
            
        
    

    在resources目录下新建log4j文件log4j.properties

    log4j.rootLogger=INFO, stdout
    log4j.appender.stdout=org.apache.log4j.ConsoleAppender
    log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
    log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
    log4j.appender.logfile=org.apache.log4j.FileAppender
    log4j.appender.logfile.File=D:\\ordercount.log
    log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
    log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

    在com.maidu.ordercount包中创建一个新类ShoppingOrderCount类,编写以下模块

    1.Mapper模块的编写

    在ShoppingOrderCount中定义一个内部类MyMapper

    public static class MyMap extends Mapper{
    
        @Override
        public void map(Object key,Text value,Context context) throws IOException ,InterruptedException {
            String line =value.toString();
            String[] arr =line.split(" "); //3 水果    水果作为键    值 1(数量1 不是 3 表示用户编号)
            if(arr.length==2){
                context.write( new Text(arr[1]),new IntWritable(1)  );
            }
        }
    }

    2.Reducer模块的编写

    在ShoppingOrderCount中定义一个内部类MyReduce

    public static class MyReduce extends Reducer{
        @Override
        protected void reduce(Text key, Iterable values, Context context) throws IOException, InterruptedException {
          int count =0;
          for(IntWritable val:values){
              count++;
          }
          context.write(key,new IntWritable(count));
    
        }
    }

    3.Driver模块的编写

    在ShoppingOrderCount类中编写主方法

    public static void main(String[] args) throws Exception{
        Configuration conf =new Configuration();
        String []otherArgs =new GenericOptionsParser(conf,args).getRemainingArgs();
        if(otherArgs.length<2){
            System.out.println("必须输入读取文件路径和输出文件路径");
            System.exit(2);
        }
    
        Job job = Job.getInstance(conf,"order count");
        job.setJarByClass(ShoppingOrderCount.class);
        job.setMapperClass(MyMap.class);
        job.setReducerClass(MyReduce.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        //添加输入的路径
        for(int i =0;i 
    

    4.使用Maven编译打包,将项目打包为jar 

    从上往下,四步走,最终target下会生产jar文件

    5.将orderCount-1.0-SNAPSHOT.jar拷贝上传到master主机上。

    6.执行Jar

    [yt@master ~]$ hadoop jar  orderCount-1.0-SNAPSHOT.jar  com.maidu.ordercount.ShoppingOrderCount  /bigdata/order.txt /output-2301-02/
     

    7.执行后查看结果

    备注:如果运行出现虚拟内存不够,请参考:is running 261401088B beyond the ‘VIRTUAL‘ memory limit. Current usage: 171.0 MB of 1 GB physical-CSDN博客

  • 相关阅读:
    unity(WebGL) 截图拼接并保存本地,下载PDF
    【网络】HTTPS讲解(侧重于加密、秘钥、证书的讲解)
    操作符 | C语言中操作符详解 | 操作符的优先级 | 移位操作法的使用方式
    代码随想录二刷 day04 | 链表之 24两两交换链表中的节点 19删除链表的倒数第N个节点 面试题 02.07. 链表相交 142.环形链表II
    Dart笔记:glob 文件系统遍历
    Bean的作用域和生命周期
    【Docker 基础教程】容器数据持久化(一)------ 数据持久化概述
    高校就业管理系统设计与实现
    安卓开发项目优化小技巧
    Gem5 O3 可视化
  • 原文地址:https://blog.csdn.net/lydia88/article/details/138151410
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号