Sqoop的安装配置及工作机制

文章目录

  • @[toc] 目录:
  • 1、简介
  • 2、sqoop安装
    • 2.1、下载并解压
    • 2.2、修改配置文件
    • 2.3、加入mysql或oracle的jdbc驱动包
    • 2.4、验证启动
  • 3、Sqoop的原理
    • 3.1、代码定制

目录:

1、简介

sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。
导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统;
导出数据:从Hadoop的文件系统中导出数据到关系数据库。
这里写图片描述

2、sqoop安装

安装sqoop的前提是已经具备java和hadoop的环境

2.1、下载并解压

下载地址:http://archive.apache.org/dist/sqoop/

2.2、修改配置文件

$ cd $SQOOP_HOME/conf
$ mv sqoop-env-template.sh sqoop-env.sh
打开sqoop-env.sh并编辑下面几行:
export HADOOP_COMMON_HOME=/home/hadoop/apps/hadoop-2.6.1/ 
export HADOOP_MAPRED_HOME=/home/hadoop/apps/hadoop-2.6.1/
export HIVE_HOME=/home/hadoop/apps/hive-1.2.1

2.3、加入mysql或oracle的jdbc驱动包

cp  ~/app/hive/lib/mysql-connector-java-5.1.28.jar   $SQOOP_HOME/lib/

2.4、验证启动

$ cd $SQOOP_HOME/bin
$ sqoop-version
预期的输出:
15/12/17 14:52:32 INFO sqoop.Sqoop: Running Sqoop version: 1.4.6
Sqoop 1.4.6 git commit id 5b34accaca7de251fc91161733f906af2eddbe83
Compiled by abe on Fri Aug 1 11:19:26 PDT 2015

到这里,整个Sqoop安装工作完成。

3、Sqoop的原理

Sqoop的原理其实就是将导入导出命令转化为mapreduce程序来执行,sqoop在接收到命令后,都要生成mapreduce程序。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。

使用sqoop的代码生成工具可以方便查看到sqoop所生成的java代码,并可在此基础之上进行深入定制开发。

3.1、代码定制

以下是Sqoop代码生成命令的语法:

$ sqoop-codegen (generic-args) (codegen-args) 
$ sqoop-codegen (generic-args) (codegen-args)

示例:以USERDB数据库中的表emp来生成Java代码为例。
下面的命令用来生成导入

$ sqoop-codegen \
--import
--connect jdbc:mysql://localhost/userdb \
--username root \ 
--table emp

如果命令成功执行,那么它就会产生如下的输出。

14/12/23 02:34:40 INFO sqoop.Sqoop: Running Sqoop version: 1.4.5
14/12/23 02:34:41 INFO tool.CodeGenTool: Beginning code generation
……………….
14/12/23 02:34:42 INFO orm.CompilationManager: HADOOP_MAPRED_HOME is /usr/local/hadoop
Note: /tmp/sqoop-hadoop/compile/9a300a1f94899df4a9b10f9935ed9f91/emp.java uses or overrides a deprecated API.
Note: Recompile with -Xlint:deprecation for details.
14/12/23 02:34:47 INFO orm.CompilationManager: Writing jar file: /tmp/sqoop-hadoop/compile/9a300a1f94899df4a9b10f9935ed9f91/emp.jar

验证: 查看输出目录下的文件

$ cd /tmp/sqoop-hadoop/compile/9a300a1f94899df4a9b10f9935ed9f91/
$ ls
emp.class
emp.jar
emp.java

如果想做深入定制导出,则可修改上述代码文件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/456482.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3D打印技术在医疗领域能做些什么?帮助精确完成手术

3D打印技术出现在20世纪90年代中期。它与普通打印工作原理基本相同,打印机内装有液体或粉末等“打印材料”,与电脑连接后,通过电脑控制把“打印材料”一层层叠加起来,最终把计算机上的蓝图变成实物。这打印技术称为3D立体打印技术…

【一些简单的jQuery选择器】

学习【js DOM 编程艺术】,最后面有许多jQuery的选择器,每个都动手敲了一遍。 jQuery 提供了高级选择器的方法。 js获取元素的三个基本方法分别是通过标签名,类名和id,即(getElementsByTagName, getElementsByClassName和getElemen…

pymysql操作mysql数据库

一、pymysql操作mysql数据库 安装pymysql pip install pymysql 1.1 pymysql操作数据库的五行拳 连接数据库 使用Connect方法连接数据库 pymysql.Connections.Connection(hostNone, userNone, password, databaseNone, port0, charset) 参数说明:host – 数据库服务…

SecureCRT常用的使用技巧

文章目录前言:1、SecureCRT 超时自动断开连接的解决办法2、SecureCRT连接Linux时,终端显示乱码的问题。3、SecureCRT使用自动记录日志功能4、使用SecureCRT从Windows上传文件到Linux5、SecureCRT配色推荐和永久设置前言: 由于工作需要&#…

解决:(1062, Duplicate entry '2019-08-30' for key 'rdate')

解决(1062, "Duplicate entry 2019-08-30 for key rdate") 显然这个问题是因为插入重复主键导致从库不工作了,更改库的唯一限制: unique 为normal 或者删除unique ALTER TABLE 表明 DROP INDEX 字节名; 实例 CREATE TABLE good_booked (au…

人民币数字金额转大写金额

public class t {public static String Trans2RMB(String money) {int index money.indexOf(".");if (index < 0) {// 没有角分money money ".00";index money.indexOf(".");}if (money.substring(index, money.length()).length() < …

eventBus 与fragment

同一个eventbut是不可以注册两次的&#xff0c;所以我们会在ondestroy方法中进行unregister&#xff08;&#xff09; 但是在fragment中&#xff0c;最好把unregister&#xff08;&#xff09;方法写到 onDestroyView&#xff08;&#xff09;方法中而不是onDestrory&#xff0…

机器学习之线性代数总结

目录1、SVD是什么、表达式是什么及对应的数学含义&#xff1b;2、了解方阵、行列式的含义&#xff08;方阵即矩阵&#xff0c;行列式即矩阵的计算结果&#xff09;3、了解代数余子式的概念4、伴随矩阵的概念5、知道方阵的逆的公式、范德蒙行列式6、知道矩阵的乘法&#xff0c;掌…

Python操作MongoDB

一 安装 pymongo pip install pymongo3.4 ​ 导入 MongoClient from pymongo import MongoClient 二 连接MongoDB数据库 MongoDB端口号:27017 连接MongoDB我们需要使用PyMongo库里面的MongoClient&#xff0c;一般来说传入MongoDB的IP及端口即可&#xff0c;第一个参数为地…

各种插件

上下滚动抽奖效果, 移动端省级联动, 时间联动 , pc端省级联动 vue 支持各种方式上传 一个不太完善的拖拽排序 react 拖拽交换插件 各种小插件 压缩图片移动端 h5上传 h5分片上传 包括服务器 slideSuper 各种滑动效果 wow.js 转载于:https://www.cnblogs.com/dhsz/p/6377956.h…

MailBee.NET Objects发送电子邮件(SMTP)教程六:创建并发送带有附件的邮件

2019独角兽企业重金招聘Python工程师标准>>> MailBee.NET Objects是一款为创建、发送、接收以及处理电子邮件而设计的健壮、功能丰富的.NET控件。几行代码便可为应用程序添加E-Mail支持&#xff0c;简单高效。具备“必需”以及独特的功能&#xff0c;这些控件帮助开…

机器学习之凸优化原理推导及相关知识总结

文章目录目录1、了解凸集和仿射集的基本概念。2、知道几何体的向量表达。3、了解超平面和半空间的概念。4、了解分割超平面和支撑超平面的含义。5、知道jensen不等式。6、掌握知识&#xff1a;凸函数。7、掌握凸优化目录 1、了解凸集和仿射集的基本概念。 凸集&#xff1a;在…

jQuery BreakingNews 间歇滚动

BreakingNews 是一款基于jQuery的间歇滚动插件。它可以设置标题、标题颜色、标题背景颜色、链接颜色、字体大小、边框、宽度、自动滚动、间歇时间等等&#xff0c;同时它还好提供两种过度方式——淡入淡出&#xff08;fade&#xff09;和向上滑动&#xff08;slide&#xff09;…

机器学习之回归总结

目录1、了解线性回归2、了解似然函数3、了解交叉验证的原理4、梯度下降算法4.1、批量梯度下降算法&#xff08;Batch Gradient Descent&#xff0c;简称BGD&#xff09;&#xff1a;4.2、随机梯度下降算法&#xff08;SGD&#xff09;&#xff1a;4.3、折中&#xff1a; 5、了解…

html中的url、href、src的区别

url不是属性&#xff0c;src和href是属性&#xff0c;src用于替换当前元素&#xff0c;href用于在当前文档和引用资源之间确立联系&#xff0c;也就是说src引用的路径是img自己的路径&#xff0c;href引用的路径是要跳转到的地方。 URL&#xff1a;Uniform Resource Locators&…

SSIS 包部署错误 0xC0010014

SSIS 包部署错误 0xC0010014 Reinhard 在部署 SSIS 包时&#xff0c;提示如下错误。 由于错误 0xC0010014“发生了一个或多个错误。在此消息之前应有更为具体的错误消息&#xff0c;对这些错误进行详细说明。此消息用作遇到错误的函数的返回值。”&#xff0c;无法加载包。当 C…

Android性能优化-App后台优化

原文链接 Background Optimizations 前言 后台进程是内存和电池敏感的。一个隐式的broadcast可能会启动很多监听它的后台进程&#xff0c;即使这些进程可能做得工作不多。这可能丢设备性能和用户体验都有比较大的影响。 为了缓解这种问题&#xff0c;7.0&#xff08;API 24&…

机器学习之决策树与随机森林

目录1、了解熵、条件熵、互信息的概念及公式1.1、熵1.2、条件熵1.3、信息增益/互信息 2、了解决策树2.1、了解决策树的概念和特点以及和熵的关系2.2、了解树生成的过程2.3、了解决策树三种算法的区别2.4、了解决策树的损失函数2.5、了解解决决策树过拟合的方法2.6、了解后剪枝的…

JSON(JavaScript Object Notation) 格式

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。 它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。JSON采用完全独立于程序语言的文本格式&#xff0c;但是也使用了类C语言的习惯。 json是 JavaScript Object Notation 的首字母缩写&…

synchronized 的理解

第一种&#xff1a;package com.ucmed.zsyy.util;/*** Created by ucmed on 2017/2/8.*/public class DirtyRead {private String username "zjkj";private String password "123";public synchronized void setValue(String username, String password)…