• 三分钟学会Sqoop安装与部署


    1.sqoop介绍

    sqoop是一个开源工具,数据搬运工,

    企业中一般运用大数据存储和关系型存储两种存储方式,但是数据的交互是个问题,故有了sqoop(sql--hadoop或Hadoop--sql)

    用户可以将数据从结构化存储器抽取到Hadoop中,用于进一步的处理,抽取的数据可以被mapreduce程序使用,也可以被其他类似与Hive、HBase的工具使用

    sqoop是连接关系型数据库和hadoop的桥梁,主要有两个方面(导入和导出):

    A.将关系型数据库的数据导入到Hadoop及其相关的系统中,如Hive和HBase

    B.将数据从Hadoop系统里抽取并导出到关系型数据库。

    2、sqoop安装

    sqoop不属于分布式软件

    下载安装包:https://sqoop.apache.org/

    sqoop属于相对稳定的开源软件,版本更新较少,本教程采用sqoop-1.4.6

    软件上传目录:node1机器    /export/software

    软件安装目录: node1机器  /export/server

     上传成功

    1)解压安装

    (可选操作)文件名较长,重命名

    mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz sqoop-1.4.6.tar.gz
    

    将其解压安装到 /export/server  实现源文件与安装目录分隔

     tar -zxvf sqoop-1.4.6.tar.gz -C ../server
    

    进入server文件夹查看解压是否完成

     注解:狗头.jpg 这里解压后的文件名还是原文件名,所以各位小白希望该名称的可以解压后改,这里特地做了一次错误示范,解压前只能改压缩包名称,不能控制解压后文件名称,这里可以再重命名一次

     mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha sqoop-1.4.6
    

     3、配置文件

    进入sqoop-1.4.6,查看了解目录结构,其目录结构同其他大数据软件类似

     进入conf文件夹

     主要配置sqoop-env.sh文件,其他几款大数据软件,如Kafka都是先给示例文件,可以直接改名或复制

    1. 以下二选一
    2. #原文件不变,新复制一份操作,我的习惯
    3. cp sqoop-env-template.sh sqoop-env.sh
    4. #原文件改名,直接操作
    5. mv sqoop-env-template.sh sqoop-env.sh

    vim sqoop-env.sh

     这里只配置了Hadoop和hive,路径根据自身安装进行填写

    另外,sqoop是关系型数据库与Hadoop的数据交互,故需要配置关系型数据库,这里选择MySQL作为示例

    之前安装Hive时,曾经替换过其MySQL连接包,到Hive下查看

     复制一个到sqoop\lib下

     cp mysql-connector-java-5.1.49.jar /export/server/sqoop-1.4.6/lib/
    

    4、验证启动

    提一点,本次安装没有配置环境变量,运行启动都要到sqoop文件夹下

    1. bin/sqoop list-databases \
    2. --connect jdbc:mysql://localhost:3306/ \
    3. --username root --password hadoop

    本命令会列出所有node1上的MySQL数据库

    换行要记得加   \

    数据库用户名、密码都是各位自己设计的

    如果使用了分布式Hadoop集群,则连接字符串中不能使用localhost,否则与数据库不在同一台机器上运行的map任务都将无法连接到数据库,建议写主机名或ip,即如下

    1. bin/sqoop list-databases \
    2. --connect jdbc:mysql://node1:3306/ \
    3. --username root --password hadoop

     至此,安装并测试完成

  • 相关阅读:
    手把手教你君正X2000开发板的OpenHarmony环境搭建
    振弦传感器土压力计的安装及埋设方法
    36个精美完整网站网页完整源码HTML+CSS+JS
    结构化编程(SP,structured programming)
    [附源码]计算机毕业设计点餐系统
    记一次 HTTPS 抓包分析和 SNI 的思考
    【nacos】快速安装
    信息学奥赛一本通:1129:统计数字字符个数
    坤坤音效键盘(Python实现)
    Acwing算法提高课——背包问题求具体方案
  • 原文地址:https://blog.csdn.net/u010763324/article/details/126802586