sqoop导入hive时间格式问题解决方案

sqoop导入hive时间格式问题解决方案

从mysql导入数据时,发现时间格式有问题,要么是时间后面多一位零,要么要使用时间戳,还能不能好好玩耍了?!
于是,我就逛论坛,找大神,最终无果,也许这个问题过于简单吧,居然没有大牛讨论。想了好几天,也看了sqoop官网,突然灵光一闪,我怎么不去看看mysql官网呢?于是,最终解决方案渐渐揭开了神秘的面纱~~~~~
首先,我们复习一下:

1. mysql 中日期与时间格式

时间日期格式对照表:
时间日期对照表
时间日期详情对比表:
时间日期详情

2.时间日期转换格式:

#第一种方法:
date_col = CAST(datetime_col AS DATE)
#第二种方法:
DATE_FORMAT(SYSDATE(),'%Y-%m-%d %H:%i:%s')

3.sqoop中抽取数据的两个命令:

--columns column_name1,column_name2...
--query 'select column_name1,column_name2...from table where $CONDITIONS'

用法比较:

--columns 后面跟我们需要的属性名,中间不能有空格,不然会报错。
--query 后面可以跟一个sql语句,那就自由了,随便有空格。但是使用时必需要有$CONDITIONS做为条件,没有其他条件就where $CONDITIONS,有其他条件就用AND连接放在最后面。
另外要说明的是,query后面支持双引号和单引号,效果相同,但如果是双引号,where $CONDITIONS会报错,需要在$前加转义字符“\”,即where \$CONDITIONS;两都比较,我们会发现,如果要转换格式,我们避免不了空格,而且我的需求还是在导入的hive表中添加mysql表中不存在的日期字段。所以只能用--query命令。

4.编辑代码:

sqoop import --hive-import \
--connect jdbc:mysql://xxx.xxx.x.x:3306/pinyougoudb \
--username root \
--password root \
--hive-table tb_name\
--query "SELECT ID,NAME,FIRST_CHAR,DATE_FORMAT(SYSDATE(),'%Y-%m-%d %H:%i:%s') AS CREATION_TIME FROM TB_BRAND WHERE \$CONDITIONS" \
--delete-target-dir \
--target-dir /export/data/sv/bas/tb_brand \
--null-string '' \
--null-non-string ''\--fields-terminated-by '\001' \-m 1;

5.查看表格数据如下:

hive> select * from tb_name;
OK
1	联想	L	2019-07-17 00:24:32
2	华为	H	2019-07-17 00:24:32
3	三星	S	2019-07-17 00:24:32
4	小米	X	2019-07-17 00:24:32
5	OPPO	O	2019-07-17 00:24:32
6	360	S	2019-07-17 00:24:32
7	中兴	Z	2019-07-17 00:24:32
8	魅族	M	2019-07-17 00:24:32
9	苹果	P	2019-07-17 00:24:32
11	诺基亚	N	2019-07-17 00:24:32
12	锤子	C	2019-07-17 00:24:32

6.时间格式转换

字符变量  	描述
%a	 工作日缩写名称(Sun.. Sat)
%b	 缩写的月份名称(Jan.. Dec)
%c	 月,数字(0.. 12)
%D	 这个月的一天,英语后缀(0th, 1st,2nd, 3rd,...)
%d	 每月的某一天,数字(00.. 31)
%e	 每月的某一天,数字(0.. 31)
%f	 微秒(000000... 999999)
%H	 小时(00.. 23)
%h	 小时(01.. 12)
%I	 小时(01.. 12)
%i	 分钟,数字(00.. 59)
%j	 一年中的一天(001.. 366)
%k 	 小时(0.. 23)
%l	 小时(1.. 12)
%M 	 月份名称(January.. December)
%m	 月,数字(00.. 12)
%p	 AM 要么 PM
%r	 时间,12小时(hh:mm:ss其次是 AM或PM)
%S	 秒(00... 59)
%s	 秒(00... 59)
%T	 时间,24小时(hh:mm:ss)
%U	 周(00.. 53),周日是一周的第一天; WEEK()模式0
%u	 周(00.. 53),周一是一周的第一天; WEEK()模式1
%V	 周(01.. 53),周日是一周的第一天; WEEK()模式2; 用于 %X
%v	 周(01.. 53),周一是一周的第一天; WEEK()模式3; 用于 %x
%W	 工作日名称(Sunday.. Saturday)
%w	 星期几(0=星期日.. 6=星期六)
%X	 星期日是星期的第一天的星期,数字,四位数; 用于%V
%x	 一周的年份,星期一是一周的第一天,数字,四位数; 用于%v
%Y	 年份,数字,四位数
%y	 年份,数字(两位数)
%%	 文字%字符
%x	 x,对于上面未列出的任何 “ x”

7.orcal时间格式转换:

TO_CHAR(CLUMNS,'yyyy-MM-dd hh24:mi:ss')
TO_CHAR(SYSDATE,'yyyy-MM-dd hh24:mi:ss')

什么?你想要时间后面跟更多或更少?好吧,压箱底儿的宝贝也给你吧:
oracle日期数据格式
如还有疑问,请留言,谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/556985.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java枚举类型(enum)详解

文章目录理解枚举类型枚举的定义枚举实现原理枚举的常见方法Enum抽象类常见方法编译器生成的Values方法与ValueOf方法枚举与Class对象枚举的进阶用法向enum类添加方法与自定义构造函数关于覆盖enum类方法enum类中定义抽象方法enum类与接口枚举与switch枚举与单例模式EnumMapEnu…

hive中导入text文件遇到的坑

今天帮一同学导入一个excel数据,我把excel保存为txt格式,然后建表导入,失败!分隔符格式不匹配,无法导入!!!!怎么看两边都是\t,怎么不匹配呢? 做为…

开窗函数的意义与用法

开窗函数——排序函数 开窗函数与其他函数的区别是,它不是关联其他表查询,而是在一张表内根据我们的想法自定义的规则分组后对我们组内的数据进行检索和计算。我们自定义的规则所分的组,就如同整张表的一个个小窗口,因此我们开出一个个小窗口并对这些小…

mysql/sqlyog导入txt文件的方法

今天尝试着用sqlyog向mysql中导入数据,用了以下几种: 一、sql载入 格式: LOAD DATA LOCAL INFILE 文件路径 INTO TABLE 表名 FIELDS TERMINATED BY 字段分隔符 LINES TERMINATED BY 行分隔符;直接进去了 代码: LOAD DATA LOCA…

XSS知识总结

XSS基础 跨站脚本(英语:Cross-site scripting,通常简称为:XSS)是一种网站应用程序的安全漏洞攻击,是代码注入的一种。它允许恶意用户将代码注入到网页上,其他用户在观看网页时就会受到影响。这…

2020有效的邮箱号大全_2020年公众号免费裂变涨粉的3个有效方法,让我一天涨粉6000...

文章来源我的公众号:运营小小喵(专注分享新媒体运营干货、写作技巧)虽然公众号一直被唱衰,但至今依然还有很多人坚持在做。但现在做公众号最大的问题,除了流量大幅下降,打开率越来越低,更重要的…

Error during job, obtaining debugging information...

今天在插入数据的时候出现错误:Error during job, obtaining debugging information… Ended Job job_1575898012755_0005 with errors Error during job, obtaining debugging information... Examining task ID: task_1575898012755_0005_m_000000 (and more) from job job…

java实现 XSS攻击防护

首先说一下什么是XSS攻击 XSS攻击全称跨站脚本攻击,是为不和层叠样式表(Cascading Style Sheets, CSS)的缩写混淆, 故将跨站脚本攻击缩写为XSS,XSS是一种在web应用中的计算机安全漏洞,它允许恶意web 用户将代码植入到提供给其它用…

动态分区添加的新字段无法插入数据

我们在使用动态分区的进程中,有时候需要新增字段,新增之后,发现该字段一直为空,无论怎么插入数据,该字段值始终不变。过去的做法就是把表删了,重建带新字段的新表,问题就解决了,今天…

Java实现XSS防御

XSS概述 跨站脚本攻击(Cross Site Scripting),缩写为XSS。恶意攻击者往Web页面里插入恶意Script代码,当用户浏览该页之时,嵌入其中Web里面的Script代码会被执行,从而达到恶意攻击用户的目的。 Servlet的方式 1、继承HttpServle…

classmethod 继承_让人眼花缭乱的类继承

Python语言的一个优势是简洁易用。是否简洁易用仅仅是Python语言本身的一个话题,但“好消息”是如果你想创造那种一大堆继承、混乱的内部关系的代码,也是可以的!今天烦人的代码来自于验证某些math-y数学分析代码。一开始,他们是发…

SQL优化之浅见

SQL优化之浅见一、查询优化二、导入大量数据时的优化三、INSERT优化四、字段注释五、说明用了段mysql/Oracle/hive等数据库,对SQL语言以Mysql为例,总结一下对sql优化方面的见解,欢迎大家补充。 一、查询优化 1.在关联查询中,关联键的数据类…

JAVA SSM框架+Redis 实现单点登录

1:什么是单点登录? 答:单点登录的英文名叫做:Single Sign On(简称SSO) 一般我们的模块都是在同一个系统下,同一个tomcat(如图,以商城为例) 后来为了维护和…

2017云栖大会门票转让_「揭秘GP」云栖大会 | Greenplum 6.0 内核优化解读和7.0展望...

9月25日,云栖大会在杭州阿里巴巴云栖小镇正式拉开序幕,三天会议期间,共吸引了200多位世界级科学家、400多家科技合作伙伴参与,科技展区面积超过3万平方米,共发布了1000多项顶尖技术。云栖大会现场在此次云栖大会上&…

从mysql到大数据(一)--开宗明义

一、大数据长什么样 长像很普通,至少看两眼后就觉得很平常。 举个栗子: 一个表格,学生信息表,里面有学号、姓名、性别、年龄、学校、学院、专业、年级、宿舍号等信息如下, 但是表在库里,我们想看&#xf…

SSO单点登录方案大全

分布式微服务系统主流常用的登录方案 前言: 单点登录其实是一个概念,主要是为了解决一次登录,多系统(本系统或外部系统)之间不需要重复登录的问题,就目前来说,主流的解决方案针对业务场景分为3个方向: 1: 同一公司,同父域下的单点登录解决方案. 如[http://map.baidu.com][[h…

em算法怎么对应原有分类_机器学习基础-EM算法

EM算法也称期望最大化(Expectation-Maximum,简称EM)算法,它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM), LDA主题模型的变分推断等等。本文就对EM算法的原理做一个总结。EM算法要解决的问题我们经常会…

从mysql到大数据(二)--数据库的认识

一、数据库的认识 数据库顾名思义,是存放数据的库房。 二、数据库的分类(了解) 可以分为两大类:关系型数据库和非关系型数据库。 关系型数据库: 关系型数据库,存储的格式可以直观地反映实体间的关系。…

postman插件下载、安装教程

这里只讲如何在Chrome 中安装postman插件 下载链接:https://pan.baidu.com/s/1vampHeD0UiDNbrB3G8j_hA 提取码:wqdl 方法/步骤 1.在Chrome输入地址:[chrome://extensions/] 2.将压缩包直接拖拽至Chrome中 3.运行在Chrome输入地址&#xff…

得力条码扫描器怎么用_广东智能物流控制系统怎么选

广东智能物流控制系统怎么选,东莞智库,东莞智库(SmartWarehouse),专注电子制造SMT智能仓库,致力于帮助电子制造企业提高物流仓储效率和效能。广东智能物流控制系统怎么选, 旭日东自动分拣系统是个集机械、电气、计算机…