sqoop导入hive时间格式问题解决方案

sqoop导入hive时间格式问题解决方案

从mysql导入数据时,发现时间格式有问题,要么是时间后面多一位零,要么要使用时间戳,还能不能好好玩耍了?!
于是,我就逛论坛,找大神,最终无果,也许这个问题过于简单吧,居然没有大牛讨论。想了好几天,也看了sqoop官网,突然灵光一闪,我怎么不去看看mysql官网呢?于是,最终解决方案渐渐揭开了神秘的面纱~~~~~
首先,我们复习一下:

1. mysql 中日期与时间格式

时间日期格式对照表:
时间日期对照表
时间日期详情对比表:
时间日期详情

2.时间日期转换格式:

#第一种方法:
date_col = CAST(datetime_col AS DATE)
#第二种方法:
DATE_FORMAT(SYSDATE(),'%Y-%m-%d %H:%i:%s')

3.sqoop中抽取数据的两个命令:

--columns column_name1,column_name2...
--query 'select column_name1,column_name2...from table where $CONDITIONS'

用法比较:

--columns 后面跟我们需要的属性名,中间不能有空格,不然会报错。
--query 后面可以跟一个sql语句,那就自由了,随便有空格。但是使用时必需要有$CONDITIONS做为条件,没有其他条件就where $CONDITIONS,有其他条件就用AND连接放在最后面。
另外要说明的是,query后面支持双引号和单引号,效果相同,但如果是双引号,where $CONDITIONS会报错,需要在$前加转义字符“\”,即where \$CONDITIONS;两都比较,我们会发现,如果要转换格式,我们避免不了空格,而且我的需求还是在导入的hive表中添加mysql表中不存在的日期字段。所以只能用--query命令。

4.编辑代码:

sqoop import --hive-import \
--connect jdbc:mysql://xxx.xxx.x.x:3306/pinyougoudb \
--username root \
--password root \
--hive-table tb_name\
--query "SELECT ID,NAME,FIRST_CHAR,DATE_FORMAT(SYSDATE(),'%Y-%m-%d %H:%i:%s') AS CREATION_TIME FROM TB_BRAND WHERE \$CONDITIONS" \
--delete-target-dir \
--target-dir /export/data/sv/bas/tb_brand \
--null-string '' \
--null-non-string ''\--fields-terminated-by '\001' \-m 1;

5.查看表格数据如下:

hive> select * from tb_name;
OK
1	联想	L	2019-07-17 00:24:32
2	华为	H	2019-07-17 00:24:32
3	三星	S	2019-07-17 00:24:32
4	小米	X	2019-07-17 00:24:32
5	OPPO	O	2019-07-17 00:24:32
6	360	S	2019-07-17 00:24:32
7	中兴	Z	2019-07-17 00:24:32
8	魅族	M	2019-07-17 00:24:32
9	苹果	P	2019-07-17 00:24:32
11	诺基亚	N	2019-07-17 00:24:32
12	锤子	C	2019-07-17 00:24:32

6.时间格式转换

字符变量  	描述
%a	 工作日缩写名称(Sun.. Sat)
%b	 缩写的月份名称(Jan.. Dec)
%c	 月,数字(0.. 12)
%D	 这个月的一天,英语后缀(0th, 1st,2nd, 3rd,...)
%d	 每月的某一天,数字(00.. 31)
%e	 每月的某一天,数字(0.. 31)
%f	 微秒(000000... 999999)
%H	 小时(00.. 23)
%h	 小时(01.. 12)
%I	 小时(01.. 12)
%i	 分钟,数字(00.. 59)
%j	 一年中的一天(001.. 366)
%k 	 小时(0.. 23)
%l	 小时(1.. 12)
%M 	 月份名称(January.. December)
%m	 月,数字(00.. 12)
%p	 AM 要么 PM
%r	 时间,12小时(hh:mm:ss其次是 AM或PM)
%S	 秒(00... 59)
%s	 秒(00... 59)
%T	 时间,24小时(hh:mm:ss)
%U	 周(00.. 53),周日是一周的第一天; WEEK()模式0
%u	 周(00.. 53),周一是一周的第一天; WEEK()模式1
%V	 周(01.. 53),周日是一周的第一天; WEEK()模式2; 用于 %X
%v	 周(01.. 53),周一是一周的第一天; WEEK()模式3; 用于 %x
%W	 工作日名称(Sunday.. Saturday)
%w	 星期几(0=星期日.. 6=星期六)
%X	 星期日是星期的第一天的星期,数字,四位数; 用于%V
%x	 一周的年份,星期一是一周的第一天,数字,四位数; 用于%v
%Y	 年份,数字,四位数
%y	 年份,数字(两位数)
%%	 文字%字符
%x	 x,对于上面未列出的任何 “ x”

7.orcal时间格式转换:

TO_CHAR(CLUMNS,'yyyy-MM-dd hh24:mi:ss')
TO_CHAR(SYSDATE,'yyyy-MM-dd hh24:mi:ss')

什么?你想要时间后面跟更多或更少?好吧,压箱底儿的宝贝也给你吧:
oracle日期数据格式
如还有疑问,请留言,谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/556985.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java枚举类型(enum)详解

文章目录理解枚举类型枚举的定义枚举实现原理枚举的常见方法Enum抽象类常见方法编译器生成的Values方法与ValueOf方法枚举与Class对象枚举的进阶用法向enum类添加方法与自定义构造函数关于覆盖enum类方法enum类中定义抽象方法enum类与接口枚举与switch枚举与单例模式EnumMapEnu…

mysql/sqlyog导入txt文件的方法

今天尝试着用sqlyog向mysql中导入数据,用了以下几种: 一、sql载入 格式: LOAD DATA LOCAL INFILE 文件路径 INTO TABLE 表名 FIELDS TERMINATED BY 字段分隔符 LINES TERMINATED BY 行分隔符;直接进去了 代码: LOAD DATA LOCA…

XSS知识总结

XSS基础 跨站脚本(英语:Cross-site scripting,通常简称为:XSS)是一种网站应用程序的安全漏洞攻击,是代码注入的一种。它允许恶意用户将代码注入到网页上,其他用户在观看网页时就会受到影响。这…

classmethod 继承_让人眼花缭乱的类继承

Python语言的一个优势是简洁易用。是否简洁易用仅仅是Python语言本身的一个话题,但“好消息”是如果你想创造那种一大堆继承、混乱的内部关系的代码,也是可以的!今天烦人的代码来自于验证某些math-y数学分析代码。一开始,他们是发…

JAVA SSM框架+Redis 实现单点登录

1:什么是单点登录? 答:单点登录的英文名叫做:Single Sign On(简称SSO) 一般我们的模块都是在同一个系统下,同一个tomcat(如图,以商城为例) 后来为了维护和…

2017云栖大会门票转让_「揭秘GP」云栖大会 | Greenplum 6.0 内核优化解读和7.0展望...

9月25日,云栖大会在杭州阿里巴巴云栖小镇正式拉开序幕,三天会议期间,共吸引了200多位世界级科学家、400多家科技合作伙伴参与,科技展区面积超过3万平方米,共发布了1000多项顶尖技术。云栖大会现场在此次云栖大会上&…

从mysql到大数据(一)--开宗明义

一、大数据长什么样 长像很普通,至少看两眼后就觉得很平常。 举个栗子: 一个表格,学生信息表,里面有学号、姓名、性别、年龄、学校、学院、专业、年级、宿舍号等信息如下, 但是表在库里,我们想看&#xf…

SSO单点登录方案大全

分布式微服务系统主流常用的登录方案 前言: 单点登录其实是一个概念,主要是为了解决一次登录,多系统(本系统或外部系统)之间不需要重复登录的问题,就目前来说,主流的解决方案针对业务场景分为3个方向: 1: 同一公司,同父域下的单点登录解决方案. 如[http://map.baidu.com][[h…

em算法怎么对应原有分类_机器学习基础-EM算法

EM算法也称期望最大化(Expectation-Maximum,简称EM)算法,它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM), LDA主题模型的变分推断等等。本文就对EM算法的原理做一个总结。EM算法要解决的问题我们经常会…

postman插件下载、安装教程

这里只讲如何在Chrome 中安装postman插件 下载链接:https://pan.baidu.com/s/1vampHeD0UiDNbrB3G8j_hA 提取码:wqdl 方法/步骤 1.在Chrome输入地址:[chrome://extensions/] 2.将压缩包直接拖拽至Chrome中 3.运行在Chrome输入地址&#xff…

得力条码扫描器怎么用_广东智能物流控制系统怎么选

广东智能物流控制系统怎么选,东莞智库,东莞智库(SmartWarehouse),专注电子制造SMT智能仓库,致力于帮助电子制造企业提高物流仓储效率和效能。广东智能物流控制系统怎么选, 旭日东自动分拣系统是个集机械、电气、计算机…

从mysql到大数据(三)--mysql数据库建模一常用数据类型及引擎

数据库的安装请自行百度。如果你想直捣黄龙练查询,没有表没有数据是不能实现的。我们从建表开始学习。但要知道,我们所有东西都是了解,学习不要有压力,不要必须要求记什么,当然,如果你不累可以记&#xff0…

Postman用法简介-Http请求模拟工具

Postman用法简介-Http请求模拟工具 在我们平时开发中,特别是需要与接口打交道时,无论是写接口还是用接口,拿到接口后肯定都得提前测试一下,这样的话就非常需要有一个比较给力的Http请求模拟工具,现在流行的这种工具也…

matlab多元函数_函数的计算机处理8(1)_1MATLAB

计算机语言运用--数值计算8-函数的计算机处理8(1)_1MATLAB计算机:电子线路组成的计算机器。人与计算机则是通过计算机语言-符号系统说给计算机听而交流。计算机语言有低级语言-机器语言、汇编、高级语言-C/C/C#/VB/PASCAL/LISP/JAVA/PYTHON/……成百上千种之多。 作…

java 怎么通过url获取远程服务器上某个文件夹下的所有文件_JMX远程代码漏洞研究...

前言:前一段时间apace solr JMX因为配置不当出现远程代码执行漏洞,最近自己在看一套java系统时,发现该系统也存在JMX远程代码漏洞,于是乎就想研究下JMX这种通用型漏洞,下面我就从原理到利用对该漏洞做一个简单的梳理。…

app每秒并发数_性能测试连载 (38) jmeter 线程数与性能测试的负载模式

点击跳转>>jmeter--由浅入深学性能系列需求下面有3个场景,思考一下在jmeter里面如何设计场景1:有一个项目,500用户同时登录,响应时间能达到多少场景2:考勤打卡,最大吞吐量能达到多少(每秒最大能完成多…

用自定义注解做点什么——自定义注解有什么用

用自定义注解做点什么 前言 你不一定听过注解,但你一定对Override不陌生。 当我们重写父类方法的时候我们就看到了Override。我们知道它表示父类方法被子类重写了。 现在告诉你,Override就是一个注解。 也许你会疑惑注解是什么? 注解&…

c++ 查找文件夹下最新创建的文件_云计算开发总结:搜索Linux文件和文件夹的方法...

当下,随着Linux在物联网、云技术、超级计算和人工智能等领域扮演关键角色,各种会议和新版本的发布令人应接不暇,Linux将迎来一个激动人心的“云时代”。如果你想把握这个风口,现在是学习Linux技术的最佳时期。今天千锋广州云计算培…

RSA 非对称加密原理

RSA 加密原理 步骤说明描述备注1找出质数P 、Q-2计算公共模数N P * Q-3欧拉函数φ(N) (P-1)(Q-1)-4计算公钥E1 < E < φ(N)E的取值必须是整数 E 和 φ(N) 必须是互质数5计算私钥DE * D % φ(N) 1-6加密C &#xff1d; M E mod NC&#xff1a;密文 M&#xff1a;明文7…

浅谈对称加密与非对称加密

在数字加密算法中&#xff0c;通过可划分为对称加密和非对称加密。 一&#xff1a;什么是对称加密&#xff1f; 在对称加密算法中&#xff0c;加密和解密使用的是同一把钥匙&#xff0c;即&#xff1a;使用相同的密匙对同一密码进行加密和解密&#xff1b; 加密过程如下&…