大数据基础设施搭建 - Sqoop

文章目录

  • 一、上传压缩包
  • 二、解压压缩包
  • 三、配置环境变量(TODO)
  • 四、修改配置文件
  • 五、拷贝MySQL驱动
  • 六、测试能否连接数据库
  • 七、import MySQL to HDFS

一、上传压缩包

官网:http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/
简介:Hadoop和关系数据库之间传输数据
部署节点:在Hadoop集群的任意节点部署都可以??因为Hadoop配置文件中指出了NameNode、ResourceManager在哪台节点上??并且配置文件分发到了所有节点上??需要部署在ResourceManager节点!!!!!!!在hadoop104上部署试一试!!
注意:需要向Hadoop集群中所有NodeManager节点开放MySQL端口号,因为Sqoop本质是MR程序,需要将MR任务提交到YARN的ResourceManager节点,由集群NodeManager计算,MR任务不一定被分配到哪个节点上,Sqoop-MR任务需要从MySQL读取数据,所以任何NodeManager节点都应该具有MySQL的读取权限。

二、解压压缩包

[hadoop@hadoop102 software]$ tar -zxf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt/module/

三、配置环境变量(TODO)

sudo vim /etc/profile.d/my_env.sh

新增内容:

#SQOOP_HOME
export SQOOP_HOME=/opt/module/sqoop-1.4.7
export PATH=$PATH:$SQOOP_HOME/bin

四、修改配置文件

[hadoop@hadoop102 sqoop-1.4.6.bin__hadoop-2.0.4-alpha]$ cd conf/
[hadoop@hadoop102 conf]$ mv sqoop-env-template.sh sqoop-env.sh
[hadoop@hadoop102 conf]$ vim sqoop-env.sh

新增内容:

#Set path to where bin/hadoop is available
export HADOOP_COMMON_HOME=/opt/module/hadoop-3.1.3#Set path to where hadoop-*-core.jar is available
export HADOOP_MAPRED_HOME=/opt/module/hadoop-3.1.3

五、拷贝MySQL驱动

[hadoop@hadoop102 software]$ cp mysql-connector-java-5.1.37.jar /opt/module/sqoop-1.4.6.bin__hadoop-2.0.4-alpha/lib/

六、测试能否连接数据库

[hadoop@hadoop102 lib]$ cd /opt/module/sqoop-1.4.6.bin__hadoop-2.0.4-alpha/
[hadoop@hadoop102 sqoop-1.4.6.bin__hadoop-2.0.4-alpha]$ bin/sqoop list-databases --connect jdbc:mysql://mall:3306/ --username root --password 123456

七、import MySQL to HDFS

需求:将MySQL中gmall库中的sku_info表导入到HDFS中。
–fields-terminated-by:Hdfs文本文件中,字段分隔符????
–compress:启动压缩(默认gzip),压缩保存到HDFS的文件。
–compression-codec:指定压缩格式。
–null-string:如果指定列为字符串类型,使用指定字符串替换值为null的该类列的值。
–null-non-string:如果指定列为非字符串类型,使用指定字符串替换值为null的该类列的值。
\N:hive中的null string格式。

注意:Sqoop本质是执行一个MR程序进行数据导入导出,所以需要向Yarn提交任务,即需要连接ResourceManager,所以ResourceManager所在机器需要向Sqoop所在机器开放8088端口。

/opt/module/sqoop-1.4.6.bin__hadoop-2.0.4-alpha/bin/sqoop import \
--connect jdbc:mysql://mall:3306/gmall \
--username root \
--password 123456 \
--target-dir /warehouse/db/gmall/sku_info/2023-11-17 \
--delete-target-dir \
--query "select id,spu_id,price,sku_name,sku_desc,weight,tm_id,category3_id,is_sale,create_time from sku_info where \$CONDITIONS" \
--num-mappers 1 \
--fields-terminated-by '\t' \
--compress \
--compression-codec gzip \
--null-string '\\N' \
--null-non-string '\\N'

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/195162.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中海达两项技术成果成功入选水利部第四届水文监测仪器设备推介名录

11月30日,由水利部科技推广中心主办,水利部国际合作与科技司和水利部水文司参与指导,长江水利委员会水文局和长江科学院共同协办的第四届水文监测仪器设备推介会在武汉香格里拉大酒店隆重举办,共有79家技术持有单位115项技术参会推…

上海亚商投顾:沪指探底回升 AI应用方向集体爆发

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 一.市场情绪 三大指数早间震荡调整,深成指盘中跌超1%,午后探底回升全线翻红,北证50指数…

模板、STL标准模板库

模板 通常 对 具有相同要求的结果或者类 提供一个模板,根据实际使用时传过来的数据类型,决定函数和类的具体实现。 模板可以让类或者函数支持一种类型,这种通用类型在实际运行的过程中可以使用任何数据类型。 这种编程方式也成为"泛型编…

代码随想录算法训练营第三十三天|509. 斐波那契数 ,70. 爬楼梯 ,746. 使用最小花费爬楼梯

509. 斐波那契数 - 力扣(LeetCode) 斐波那契数 (通常用 F(n) 表示)形成的序列称为 斐波那契数列 。该数列由 0 和 1 开始,后面的每一项数字都是前面两项数字的和。也就是: F(0) 0,F(1) 1 F(…

画图带你理清TCP协议三次握手和四次挥手

TCP 特性 1.确认应答机制 (ACK) 2.超时重传 3.建立连接 - 三次握手 4.断开连接 - 四次挥手 1.确认应答机制 (ACK) 确认应答是可靠传输的最核心机制,接收方反馈一个应答报文(ACK),表示已收到 假设现在 A 想去 B 家里玩游戏,于是 A 给…

MTKSetings新增高精度定位菜单

菜单开关只有在切换的时候生效,如果默认打开,需底层驱动直接将节点打开。 vendor/mediatek/proprietary/packages/apps/MtkSettings/res/xml/location_services.xml <?xml version="1.0" encoding="utf-8"?> <!-- Copyright (C) 2015 The An…

SEO外链工具,免费SEO引蜘蛛工具

随着互联网的迅猛发展&#xff0c;网站的排名成为各类企业的突破口。SEO&#xff08;Search Engine Optimization&#xff09;作为提高网站在搜索引擎中排名的重要手段&#xff0c;其成功与否直接关系到网站能否获得更多的曝光和流量。在SEO的世界中&#xff0c;引蜘蛛与外链的…

6-3 求3*3整数矩阵对角线元素之和

#include<stdio.h>int main(){int a[3][3],sum0;int i ,j;printf("输入元素&#xff1a;\n");for(i0;i<3;i)for(j0;j<3;j)scanf("%d",&a[i][j]);for(i0;i<3;i)sumsuma[i][i];printf("总和为&#xff1a;%d",sum);return 0;}

数位DP(acwing)

https://www.acwing.com/problem/content/1083/ 代码&#xff1a; #include <iostream> #include <cstring> #include <algorithm> #include <vector> using namespace std; const int N 35; int l , r; int K , B; int f[N][N]; void init() // …

如何购买阿里云服务器

作为一家全球领先的云计算服务提供商&#xff0c;阿里云提供了多种云产品和解决方案&#xff0c;包括云服务器、对象服务OSS、数据库、存储、SSL、域名和CDN等。阿里云服务器是一种灵活可扩展的云计算服务&#xff0c;适用于各种规模和类型的企业和个人用户。阿里云以其出色的性…

IntelliJ插件开发-版本升级

简介 idea启动过程中&#xff0c;并不会自动去插件市场检查插件是否有更新。发布插件后&#xff0c;需要用户重启IDE&#xff0c;或者点击help -> check for updates&#xff0c;体验不太好。 如何自动检查更新 可以通过以下步骤来实现插件更新&#xff1a; 实现版本管理…

邮件迁移-邮件同步-批量完成邮件迁移解决方案-imapsync

背景&#xff1a; 公司原来使用的邮箱服务器实现方式是james的cassandra-app&#xff0c;如今要启用新的邮件服务器&#xff0c;架构用的是james的distributed-app,升级后&#xff0c;要求邮件数据不丢失&#xff0c;因此要平滑完成邮件的迁移工作&#xff0c;保障升级后邮件不…

Java BIO、NIO、AIO 有什么区别?

Java BIO、NIO、AIO 有什么区别&#xff1f; Java的I/O&#xff08;输入/输出&#xff09;主要有三种模型&#xff1a;BIO&#xff08;Blocking I/O&#xff09;、NIO&#xff08;Non-blocking I/O&#xff09;和AIO&#xff08;Asynchronous I/O&#xff09;。它们之间的主要…

文章解读与仿真程序复现思路——中国电机工程学报EI\CSCD\北大核心《考虑量化储热的多区域电–热综合能源系统优化调度》

标题 "考虑量化储热的多区域电–热综合能源系统优化调度" 可以分解为几个关键词和短语&#xff0c;我们逐步解读&#xff1a; 考虑量化储热&#xff1a; 考虑&#xff1a; 意味着在解决问题或进行研究时&#xff0c;会综合或纳入特定因素。量化&#xff1a; 将抽象的…

旺店通·企业奇门对接打通金蝶云星空查询店铺接口与客户新增接口

旺店通企业奇门对接打通金蝶云星空查询店铺接口与客户新增接口 数据源系统:旺店通企业奇门 旺店通是北京掌上先机网络科技有限公司旗下品牌&#xff0c;国内的零售云服务提供商&#xff0c;基于云计算SaaS服务模式&#xff0c;以体系化解决方案&#xff0c;助力零售企业数字化智…

android.view.WindowLeaked解决方法

问题 我在使用WindowManager添加一个button&#xff0c; windowManager.addView(button,layoutParams);然后关闭当前的这个Activity的时候遇到了WindowLeak这个问题&#xff0c;也就是所谓的窗体泄露。 原因 主要原因是因为android只允许在UI主线程操作&#xff0c;我在使用W…

计算机相关行业在大数据库时代下的潮流和趁势

还记得当初自己为什么选择计算机&#xff1f; 随着数据的爆炸性增长&#xff0c;数据科学和数据分析成为了热门的领域。这些专业涉及处理和分析大规模数据集的技术和方法&#xff0c;以从中提取有价值的信息和洞察。数据科学家和数据分析师在各个行业中的需求不断增加&#xf…

编译原理实验词法分析

编译原理实验中的词法分析是编译过程的一个重要环节。它的任务是从左到右读入源程序的字符流&#xff0c;识别出一个个的单词&#xff0c;即基本保留字、标识符、常数、运算符、分隔符五大类。 在识别出下一个单词后&#xff0c;词法分析程序会验证其词法正确性&#xff0c;然…

asp.net FTP客户端设计与开发

4.1 软件总体分析与设计 根据需求分析&#xff0c;按照系统开发的基本观点对功能进行分解&#xff0c;从功能上可对模块作如下划分&#xff1a; 1.连接管理模块:主要完成主机与服务器之间的连接与关闭操作。 2.文件管理模块:主要完成文件的显示、新建文件、删除文件等。 3.文件…

卖家低价侵权了怎么处理

店铺如果未经品牌允许&#xff0c;做了产品销售&#xff0c;其实从知识产权的角度出发&#xff0c;对于品牌来说&#xff0c;店铺这种行为属于侵权&#xff0c;侵犯了品牌的商标权、著作权、专利权等&#xff0c;所以品牌可以对店铺进行知识产权维权&#xff0c;店铺如果未授权…