ETL异构数据源Datax_使用数据分片提升同步速度_05

文章目录

            • 1. 构建json,添加数据分片
            • 2. Mysql数据清除
            • 3. 数据分片前后对比

1. 构建json,添加数据分片

在这里插入图片描述

{"job": {"setting": {"speed": {"channel": 3},"errorLimit": {"record": 0,"percentage": 0.02}},"content": [{"reader": {"name": "oraclereader","parameter": {"column": ["IDNO","COL1","COL2","COL3","DT","COL5","COL6","COL7","COL8","COL9","COL10"],splitPk:"IDNO","connection": [{"jdbcUrl": ["jdbc:oracle:thin:@192.xxx.xxx.xxx:1521:orcl"],"table": ["TEST.OTBS1"]}],"username": "username","password": "password"}},"writer": {"name": "mysqlwriter","parameter": {"column": ["IDNO","COL1","COL2","COL3","DT","COL5","COL6","COL7","COL8","COL9","COL10"],"connection": [{"jdbcUrl": "jdbc:mysql://127.0.0.1:3306/datax?autoReconnect=true&useUnicode=true&characterEncoding=utf8&zeroDateTimeBehavior=CONVERT_TO_NULL&useSSL=false&serverTimezone=CTT&nullCatalogMeansCurrent=true","table": ["otbs1"]}],"username": "root","password": "123456"}}}]}
}
2. Mysql数据清除

清除mysql otbs1表数据

truncate table otbs1; 
3. 数据分片前后对比

数据分片前

2021-06-23 12:28:12.390 [job-0] INFO  StandAloneJobContainerCommunicator - Total 1048576 records, 69143488 bytes | Speed 1.65MB/s, 26214 records/s | Error 0 records, 0 bytes |  All Task WaitWriterTime 26.038s |  All Task WaitReaderTime 8.483s | Percentage 100.00%
2021-06-23 12:28:12.402 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-06-23 12:27:31
任务结束时刻                    : 2021-06-23 12:28:12
任务总计耗时                    :                 41s
任务平均流量                    :            1.65MB/s
记录写入速度                    :          26214rec/s
读出记录总数                    :             1048576
读写失败总数                    :                   0channel并发3个未生效

数据分片后

2021-06-23 12:59:01.629 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-06-23 12:58:29
任务结束时刻                    : 2021-06-23 12:59:01
任务总计耗时                    :                 31s
任务平均流量                    :            2.20MB/s
记录写入速度                    :          34952rec/s
读出记录总数                    :             1048576
读写失败总数                    :                   0

速度相比数据分片前提升了10s

同步日志,相比数据分片前做了数据分片处理,并发3个channel处理16个任务。
channel并发3个未生效
在这里插入图片描述

2021-06-23 12:58:31.020 [job-0] INFO  JobContainer - jobContainer starts to do prepare ...
2021-06-23 12:58:31.020 [job-0] INFO  JobContainer - DataX Reader.Job [oraclereader] do prepare work .
2021-06-23 12:58:31.020 [job-0] INFO  JobContainer - DataX Writer.Job [mysqlwriter] do prepare work .
2021-06-23 12:58:31.021 [job-0] INFO  JobContainer - jobContainer starts to do split ...
2021-06-23 12:58:31.021 [job-0] INFO  JobContainer - Job set Channel-Number to 3 channels.
2021-06-23 12:58:31.113 [job-0] INFO  SingleTableSplitUtil - split pk [sql=SELECT * FROM ( SELECT IDNO FROM DBTEST.OTBS1 SAMPLE (0.1)  WHERE (IDNO IS NOT NULL)  ORDER BY DBMS_RANDOM.VALUE) WHERE ROWNUM <= 15 ORDER by IDNO ASC] is running... 
2021-06-23 12:58:31.389 [job-0] INFO  SingleTableSplitUtil - After split(), allQuerySql=[
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (42075 <= IDNO AND IDNO < 77408) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (77408 <= IDNO AND IDNO < 187833) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (187833 <= IDNO AND IDNO < 263631) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (263631 <= IDNO AND IDNO < 349253) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (349253 <= IDNO AND IDNO < 364994) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (364994 <= IDNO AND IDNO < 434398) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (434398 <= IDNO AND IDNO < 437250) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (437250 <= IDNO AND IDNO < 516705) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (516705 <= IDNO AND IDNO < 555961) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (555961 <= IDNO AND IDNO < 578695) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (578695 <= IDNO AND IDNO < 638120) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (638120 <= IDNO AND IDNO < 655685) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (655685 <= IDNO AND IDNO < 859873) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (859873 <= IDNO AND IDNO <= 962533) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  ((IDNO < 42075) OR (962533 < IDNO)) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  IDNO IS NULL
].
2021-06-23 12:58:31.390 [job-0] INFO  JobContainer - DataX Reader.Job [oraclereader] splits to [16] tasks.
2021-06-23 12:58:31.394 [job-0] INFO  JobContainer - DataX Writer.Job [mysqlwriter] splits to [16] tasks.
2021-06-23 12:58:31.431 [job-0] INFO  JobContainer - jobContainer starts to do schedule ...
2021-06-23 12:58:31.460 [job-0] INFO  JobContainer - Scheduler starts [1] taskGroups.
2021-06-23 12:58:31.463 [job-0] INFO  JobContainer - Running by standalone Mode.
2021-06-23 12:58:31.487 [taskGroup-0] INFO  TaskGroupContainer - taskGroupId=[0] start [3] channels for [16] tasks.
2021-06-23 12:58:31.508 [taskGroup-0] INFO  Channel - Channel set byte_speed_limit to -1, No bps activated.
2021-06-23 12:58:31.508 [taskGroup-0] INFO  Channel - Channel set record_speed_limit to -1, No tps activated.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/517984.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flink 1.9 实战:使用 SQL 读取 Kafka 并写入 MySQL

上周六在深圳分享了《Flink SQL 1.9.0 技术内幕和最佳实践》&#xff0c;会后许多小伙伴对最后演示环节的 Demo 代码非常感兴趣&#xff0c;迫不及待地想尝试下&#xff0c;所以写了这篇文章分享下这份代码。希望对于 Flink SQL 的初学者能有所帮助。完整分享可以观看 Meetup 视…

java的基础语法和数据类型,IDEA

IDEA的用法 快捷方法 主函数&#xff1a;psvm输出语句&#xff1a;sout java基础语法注释 注释&#xff1a;必须要写注释 单行注释&#xff1a;//多行注释&#xff1a;/**/文档注释javaDoc&#xff1a;/***/ 平时写代码要注意规范 标识符和关键字 所有标识符应该都以字母&…

手把手教你配置VS Code 远程开发工具,工作效率提升N倍

来源 | 后端技术学堂责编 | Carol封图 | CSDN 付费下载于视觉中国今天和大家分享一个远程开发解决方案&#xff0c;聊一聊我平常是如何用 VS Code 进行远程开发工作的&#xff0c;以及一步步教你搭建远程开发环境&#xff0c;拥有比德芙还丝滑的远程开发体验。我们厂里为了最大…

蚂蚁金服隗华:十五年时间见证分布式数据库的崛起

北大计算所启蒙 “做中国人自己的技术” 如果用一句话来评价读书时的隗华&#xff08;花名&#xff1a;风羿&#xff09;&#xff0c;那一定是“德智体美劳全面发展的好学生”。本科在北航读的计算机专业&#xff0c;硕士则就读于北大的计算机研究所。 北大&#xff0c;中国高…

java的整数扩展,浮点数扩展,字符扩展,转义字符,布尔值扩展

java的整数扩展&#xff0c;浮点数扩展&#xff0c;字符扩展&#xff0c;转义字符&#xff0c;布尔值扩展 public static void main(String[] args) {//整数扩展 进制 二进制0b 十进制 八进制0 十六进制0xint i10;int i2010;//八进制int i30x10;//十六进制0x …

用户数从 0 到亿,我的 K8s 踩坑血泪史

导读&#xff1a;容器服务 Kubernetes 是目前炙手可热的云原生基础设施&#xff0c;作者过去一年上线了一个用户数极速增长的应用&#xff1a;该应用一个月内日活用户从零至四千万&#xff0c;用户数从零到一亿的裂变式增长&#xff0c;充分享受了容器服务快速简便的扩容操作和…

行,Python玩大了!​取代Excel,程序员:太牛!你怎么看?

Python真的玩大了吗&#xff1f;2020年&#xff0c;Python程序员究竟怎么样&#xff1f;A与B程序员与远方近日日本最大的证券公司之一野村证券首席数字官马修汉普森&#xff0c;在Quant Conference上发表讲话&#xff1a;“用Excel的人越来越少&#xff0c;大家都在用Python。”…

ETL异构数据源Datax_限速设置_06

文章目录一、提升job内Channel并发有几种配置方式二、配置简述三、案例3.1. 第一种3.2. 第二种3.3. 第三种3.4. 第四种3.5. 案例实战3.6. 总结前言&#xff1a; 在DataX内部对每个Channel会有严格的速度控制&#xff0c;分两种&#xff0c;一种 是控制每秒同步的记录数&#xf…

云原生计算重塑企业IT架构 - 分布式应用架构

进入21世纪以来&#xff0c;我们见证了企业分布式应用架构从SOA(Service-oriented Architecture)&#xff0c;到微服务架构&#xff0c;再到云原生应用架构的演化。 为了说明企业架构演化背后的思考&#xff0c;我们先谈一些玄学。 第一&#xff0c;企业IT系统的复杂性&#…

首发!《长安十二时辰背后的技术秘籍》正式公开,速来下载

一名死囚如何在十二时辰内利用“唐代黑科技”&#xff0c;拯救长安百姓于水火中&#xff1f; 这就是《长安十二时辰》的故事&#xff0c;剧中有恢弘的长安美景、让人流口水的水晶柿子/水盆羊肉&#xff0c;还有张小敬和檀棋“在一起”呼声……然而&#xff0c;最让人刮目相看的…

【快讯】呼伦贝尔市人民医院利用Oracle APEX快速开发预检分诊系统

疫情期间&#xff0c;实施入口管控、患者分流、防止院内交叉传染是医院防控工作的重中之重。 内蒙古呼伦贝尔市人民医院信息科主任张布林借助Oracle APEX敏捷开发工具&#xff0c;仅用三天时间&#xff0c;为医院开发并上线了“预检分诊系统”&#xff0c;实现患者信息采集和预…

类型转换。

类型转换 由于Java是强类型语言&#xff0c;所以进行有些运算&#xff0c;就要类型转换 低-----------------------------------------------------高 byte,short,char一>long一>float一>double 运算中&#xff0c;不同类型的数据需要转换为同一类型&#xff0c;然…

ETL异构数据源Datax_MySQL同步Oracle(全量)_07

文章目录1. 清除Oracle数据库中OTBS1表的数据2. 构建json3. 执行脚本4. 同步验证5. 同步分析7. 同步结果1. 清除Oracle数据库中OTBS1表的数据 Truncate TABLE OTBS1;2. 构建json {"core": {"transport": {"channel": {"speed": {&qu…

左手代码右手滑板 支付宝这个程序员有些酷

走在杭州支付宝z空间的园区&#xff0c;常常可以看到一个脚踩滑板&#xff0c;脑后扎个发髻的男青年。 他叫边柳。来蚂蚁金服三年&#xff0c;除了是一名前端码农&#xff0c;也是一位斜杠青年。捧着程序员的“饭碗”&#xff0c;兼顾着滑板和摇滚的爱好&#xff0c;可以说他过…

2019阿里云910会员节大促主会场全攻略

2019阿里云910会员大促活动已经于8月28日正式开启&#xff0c;从已开放的活动页面来看&#xff0c;整场大促活动由阿里云10年有礼时光机、爆款产品推荐、七大分会场组成。 在910这个秋季大幅度优惠促销日&#xff0c;怎样才能花最少的钱配置最特惠的云服务&#xff1f;云栖社区…

变量 常量 作用域和命名规范

变量 常量 作用域和命名规范 变量&#xff1a; 变量&#xff1a;可以变化的量 java是一种强类型的语言&#xff0c;每个变量必须声明其类型。 Java变量是程序中最基本的储存单位&#xff0c;其要素包括变量名。变量类型和作业域 注意事项 每个变量都有类型&#xff0c;类型…

浪潮商用机器与腾讯TDSQL完成互认证 共同拓展Power行业生态

日前&#xff0c;浪潮商用机器有限公司宣布&#xff0c;旗下K1 Power服务器系列产品经过几十项基础功能和高可用功能用例的专业测试&#xff0c;与腾讯新兴国产分布式数据库TDSQL完美兼容&#xff0c;且性能优异&#xff0c;可进行顺利的部署、平稳的运行及对外提供服务。此次互…

历时五天用 SwiftUI 做了一款 APP,阿里工程师如何做的?

作者|姜沂(倾寒) 出品|阿里巴巴新零售淘系技术部 导读&#xff1a;自 2014 年苹果发布会发布 Swift 之后, Swift 经过多年迭代&#xff0c;终于达到了 ABI 稳定版本&#xff0c;也意味着 Swift 做为稳定的得语言&#xff0c;值得用在大型 APP&#xff0c; 用来生产环境中。 2…

Istio从懵圈到熟练 – 二分之一活的微服务

Istio is the future&#xff01;基本上&#xff0c;我相信对云原生技术趋势有些微判断的同学&#xff0c;都会有这个觉悟。其背后的逻辑其实是比较简单的&#xff1a;当容器集群&#xff0c;特别是K8S成为事实上的标准之后&#xff0c;应用必然会不断的复杂化&#xff0c;服务…

数据结构与算法、讲解、动态规划一脸懵?看完之后轻松掌握!

来源 | 昊天码字责编 | Carol封图 | CSDN 付费下载于视觉中国碰到动态规划问题摸不着头脑&#xff1f;总结不出动态规划的类型&#xff1f;有多少人曾经历过这种迷茫与无助&#xff1f;看完本文&#xff0c;让你一脚迈进动态规划的大门。我们在用递归求解问题的过程中&#xff…