ETL异构数据源Datax_日期增量同步_13

文章目录

          • 一、全量同步
            • 1. 增量同步SQL
            • 2. 构建reader
            • 3. 构建writer
            • 4. 字段对应关系映射
            • 5. 构建json
            • 6. 选择同步模板
            • 7. 查询最早时间
            • 8. 修改任务信息
            • 9. 添加增量参数
            • 10. 数据清理
            • 11. 执行任务
            • 12. 查看执行日期
            • 13. 数据验证
            • 15. 查看同步脚本
          • 二、基于日期增量同步
            • 2.1. 新增新数据
            • 2.2. 执行数据同步
            • 2.3. 查看日志
            • 2.4. 查看数据库
            • 2.5. 日期选取

一、全量同步

声明:
以增量方式数据同步,第一次是全量同步,从第二次同步开始以第一次同步完成后的时间为开始时间,进行增量同步!
注:咱们添加项目、添加任务模板先用以前的,直接任务构建

1. 增量同步SQL
		select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from otbs1 where dt > to_date(${lastTime},'yyyy-mm-dd hh24:mi:ss') and dt <= to_date(${currentTime},'yyyy-mm-dd hh24:mi:ss')
2. 构建reader

构建reader,填写增量同步SQL
在这里插入图片描述

3. 构建writer

在这里插入图片描述

4. 字段对应关系映射

在这里插入图片描述

5. 构建json

在这里插入图片描述

6. 选择同步模板

基础模板,可以在执行同步前进行任务信息的修改
在这里插入图片描述
在这里插入图片描述
刷新页面

7. 查询最早时间

查询同步数据的最早时间和最晚时间,等会会以最早时间为开始时间进行同步
在这里插入图片描述

在这里插入图片描述

8. 修改任务信息

在这里插入图片描述

9. 添加增量参数

在这里插入图片描述

-DlastTime='%s' -DcurrentTime='%s'

在这里插入图片描述

10. 数据清理

清空mysql数据库otbs1表的数据
在这里插入图片描述

11. 执行任务

在这里插入图片描述

12. 查看执行日期

在这里插入图片描述
如果不显示就刷新页面
在这里插入图片描述
在这里插入图片描述

13. 数据验证

在这里插入图片描述

15. 查看同步脚本

存量同步完成之后,查看同步脚本
在这里插入图片描述

在这里插入图片描述
从图中可以看出,以增量形式同步全量第一次完成后,开始时间自动变更成了当前时间,以后增量同步,就会一当前时间作为开始时间继续增量同步!

二、基于日期增量同步

查询数据库目前idno最大值
在这里插入图片描述
1048577

2.1. 新增新数据

新增3条数据

insert into otbs1 (IDNO, COL1, COL2, COL3, DT, COL5, COL6, COL7, COL8, COL9, COL10)
values ('1048578', '字符串1', '1', '1696248667889', '2021-06-29 13:22:26', '3.141592653578', '字符串2', '字符串3', '字符串4', '字符串5', '字符串6');
insert into otbs1 (IDNO, COL1, COL2, COL3, DT, COL5, COL6, COL7, COL8, COL9, COL10)
values ('1048579', '字符串1', '1', '1696248667889', '2021-06-29 13:22:26', '3.141592653578', '字符串2', '字符串3', '字符串4', '字符串5', '字符串6');
insert into otbs1 (IDNO, COL1, COL2, COL3, DT, COL5, COL6, COL7, COL8, COL9, COL10)
values ('1048580', '字符串1', '1', '1696248667889', '2021-06-29 13:22:26', '3.141592653578', '字符串2', '字符串3', '字符串4', '字符串5', '字符串6');

在这里插入图片描述
插入后再次查询idno最大值
在这里插入图片描述
1048580,在以前基础上堵了3条数据。

2.2. 执行数据同步

如果,这次增量同步的数量为3条,就说明是增量数据同步对吧

在这里插入图片描述

2.3. 查看日志

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
从同步日志可以看出,只同步了3条数据

2.4. 查看数据库

多了3条数据
在这里插入图片描述

2.5. 日期选取

找一个关键的业务日期

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/517879.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用 SQL Server FILESTREAM 存储非结构化数据?这篇文章告诉你!

作者 | ALEN İBRI译者 | 火火酱&#xff0c;责编 | Carol封图 | CSDN 付费下载于视觉中国 在本文中&#xff0c;我将解释如何使用SQL Server FILESTREAM来存储非结构化数据。同时&#xff0c;还会介绍FILESTREAM的优缺点。 在SQL Server的早期版本中&#xff0c;非结构化数据的…

Apache Flink 进阶入门(二):Time 深度解析

前言 Flink 的 API 大体上可以划分为三个层次&#xff1a;处于最底层的 ProcessFunction、中间一层的 DataStream API 和最上层的 SQL/Table API&#xff0c;这三层中的每一层都非常依赖于时间属性。时间属性是流处理中最重要的一个方面&#xff0c;是流处理系统的基石之一&am…

月活用户达7.55亿,阿里淘系如何在后流量时代引爆用户增长?

2019 年 8 月&#xff0c;阿里巴巴集团公布截至 2019 年 6 月 30 日止季度业绩。 财报显示&#xff0c;本季度阿里巴巴集团收入为 1149.24 亿元人民币&#xff0c;同比增长 42%。其中&#xff0c;淘宝、天猫在内的中国零售平台移动月活跃用户达 7.55 亿&#xff0c;较上一季度…

数组,三种初始化和内存分析

数组&#xff0c;三种初始化和内存分析 Java内存分析&#xff1a; 堆&#xff1a;存放new的对象和数组 ​ 可以被所有的线程共享&#xff0c;不会存放别的对象引用 栈&#xff1a;存放基本变量类型&#xff08;会包含这个基本类型的具体数值&#xff09; ​ 引用对象的变量&a…

Arthas 3.1.2 版本发布 | 增加 logger/heapdump/vmoption 命令

最近偶尔有用户反馈某些 HTTP 接口出现超时问题&#xff0c;而 web 服务端的 Trace 监控没有出现 http 返回值为 503 等异常情况。出现这种情况一般是web容器出现问题&#xff0c;客户端连 Arthas是Alibaba开源的Java诊断工具&#xff0c;深受开发者喜爱。 Github&#xff1a;h…

Linux 便笺技巧专栏

文章目录一、 vi 专栏二、固定ip设置2.1. 自动获取改为静态2.2. IDADDR获取2.3. GATEWAY获取2.4. 重新网卡2.5. 重新连接三、主机名调整3.1. 临时有效主机名3.2. 永久有效主机名四、防火墙调整4.1. 临时关闭防火墙4.2. 开机不启动防火墙五、shell脚本5.1. shell格式5.2. shell执…

刚刚,Python内幕被爆出!网友:请收下我的膝盖!

2020 年 5 月全国招收程序员 312761 人。2020 年 5 月全国程序员平均工资 14542 元&#xff0c;工资中位数 12500 元&#xff0c;其中 95% 的人的工资介于 5250 元到 35000 元。请问你拖后腿了吗&#xff1f;作为一名老码农&#xff0c;这次请收下我的膝盖&#xff01;事情起因…

阿里99大促 | 模型识别背后的样本生成

背景 在上一篇文章详解阿里99大促活动页内容识别技术实现&#xff0c;我们介绍了在淘宝99大促中&#xff0c;我们使用了怎样的算法模型去识别并完成自动化测试的。 迫切解决的样本问题 淘宝大促有近百个模块、上千个页面&#xff0c;模块间具有相似性&#xff0c;并且模块内…

这6种编码方法,你掌握了几个?

阿里妹导读&#xff1a;Don Roberts 提出的一条重构准则&#xff1a;第一次做某件事时只管去做&#xff1b;第二次做类似的事时会产生反感&#xff0c;但无论如何还是可以去做&#xff1b;第三次再做类似的事时&#xff0c;你就应该重构。 编码也是如此&#xff0c;当多次编写…

扎根中国20年,F5“代码到用户”线上峰会盛大启幕

2020年5月20日&#xff0c;全球领先的多云应用服务厂商F5公司以线上峰会的形式开启了F5 2020 “代码到用户” 暨F5中国20周年纪念庆典&#xff0c;深入解读了F5“代码到用户” 的战略。F5全球首席执行官范仲林先生、F5全球首席科学家及首席技术官林耕先生、NGINX创始人Igor Sys…

Hadoop集群安装部署_伪分布式集群安装_01

文章目录一、配置基础环境1. 设置静态ip2. hostname3. firewalld4. ssh免密码登录5. JDK一、配置基础环境 1. 设置静态ip [rootbigdata01 ~]# vi /etc/sysconfig/network-scripts/ifcfg-ens33BOOTPROTO"static" IPADDR192.168.92.100 GATEWAY192.168.92.2 DNS1192.…

Hadoop集群安装部署_伪分布式集群安装_02

文章目录一、解压安装1. 安装包上传2. 解压hadoop安装包二、修改Hadoop相关配置文件2.1. hadoop-env.sh2.2. core-site.xml2.3. hdfs-site.xml2.4. mapred-site.xml2.5. yarn-site.xml2.6. workers三、格式化与启动集群3.1. 格式化HDFS3.2. 启动伪分布集群3.3. 异常解决方案3.4…

在 520 这天,竟然有人把 Docker讲清楚了? | 原力计划

作者 | 夏目 "责编 | 王晓曼头图 | CSDN下载自东方IC出品 | CSDN博客简介1、了解Docker的前生LXCLXC为Linux Container的简写。可以提供轻量级的虚拟化&#xff0c;以便隔离进程和资源&#xff0c;而且不需要提供指令解释机制以及全虚拟化的其他复杂性。相当于C中的NameSp…

为什么它有典型FaaS能力,却是非典型FaaS架构?

阿里妹导读&#xff1a;FaaS—Function as a service&#xff0c;函数即服务。它是2014年由于亚马逊的AWS Lambda的兴起&#xff0c;而被大家广泛认知。FaaS能力是NBF中的一项非常重要的能力&#xff0c;NBF是一个非典型的FaaS架构&#xff0c;但是具备了典型的FaaS能力。文章将…

如何解决90%的问题?10位阿里大牛公布方法

世界在变&#xff0c;技术在变&#xff0c;需求在变。 唯一不变的是变化。 面对变化&#xff0c;技术人如何在不确定性的世界中寻找最优解&#xff1f; 查理芒格说&#xff1a;“掌握一定数量的思维模型&#xff0c;能解决这世上90%的问题。”与其在重复的“增、删、改、查”…

Hadoop集群安装部署_分布式集群安装_01

文章目录1. 分布式集群规划2. 数据清理3. 基础环境准备4. 配置ip映射5. 时间同步6. SSH免密码登录完善7. 免密登录验证1. 分布式集群规划 伪分布集群搞定了以后我们来看一下真正的分布式集群是什么样的 看一下这张图&#xff0c;图里面表示是三个节点&#xff0c;左边这一个是…

今天,Python信息量很大!

小白程序员Python自学之痛&#xff1a;第一周找学习资源&#xff0c;第二周入门到放弃&#xff0c;第三周怀疑自己。明明10元钱就能搞定的事情&#xff0c;为什么要反反复复折磨自己呢&#xff1f;为了让用户用更优惠的价格买到优质的课程&#xff0c;CSDN和老师反复争取&#…

闲鱼如何利用端计算提升推荐场景的ctr

背景 闲鱼作为一个电商场景的app&#xff0c;最丰富的部分就是作为商品宝贝浏览承载的feeds&#xff0c;比如首页下面的宝贝信息流&#xff0c;搜索结果页以及详情页下面的猜你喜欢&#xff0c;这些feeds场景都少不了推荐算法在背后的支撑。 传统的推荐算法是依托于云上沉淀的…

Hadoop集群安装部署_分布式集群安装_02

文章目录一、上传与 解压1. 上传安装包2. 解压hadoop安装包二、修改hadoop相关配置文件2.1. hadoop-env.sh2.2. core-site.xml2.3. hdfs-site.xml2.4. mapred-site.xml2.5. yarn-site.xml2.6. workers2.7. 修改启动脚本三、同步初始化3.1. 安装包同步3.2. 主节点格式化HDFS3.3.…