ETL异构数据源Datax_使用数据分片提升同步速度_05

文章目录

            • 1. 构建json,添加数据分片
            • 2. Mysql数据清除
            • 3. 数据分片前后对比

1. 构建json,添加数据分片

在这里插入图片描述

{"job": {"setting": {"speed": {"channel": 3},"errorLimit": {"record": 0,"percentage": 0.02}},"content": [{"reader": {"name": "oraclereader","parameter": {"column": ["IDNO","COL1","COL2","COL3","DT","COL5","COL6","COL7","COL8","COL9","COL10"],splitPk:"IDNO","connection": [{"jdbcUrl": ["jdbc:oracle:thin:@192.xxx.xxx.xxx:1521:orcl"],"table": ["TEST.OTBS1"]}],"username": "username","password": "password"}},"writer": {"name": "mysqlwriter","parameter": {"column": ["IDNO","COL1","COL2","COL3","DT","COL5","COL6","COL7","COL8","COL9","COL10"],"connection": [{"jdbcUrl": "jdbc:mysql://127.0.0.1:3306/datax?autoReconnect=true&useUnicode=true&characterEncoding=utf8&zeroDateTimeBehavior=CONVERT_TO_NULL&useSSL=false&serverTimezone=CTT&nullCatalogMeansCurrent=true","table": ["otbs1"]}],"username": "root","password": "123456"}}}]}
}
2. Mysql数据清除

清除mysql otbs1表数据

truncate table otbs1; 
3. 数据分片前后对比

数据分片前

2021-06-23 12:28:12.390 [job-0] INFO  StandAloneJobContainerCommunicator - Total 1048576 records, 69143488 bytes | Speed 1.65MB/s, 26214 records/s | Error 0 records, 0 bytes |  All Task WaitWriterTime 26.038s |  All Task WaitReaderTime 8.483s | Percentage 100.00%
2021-06-23 12:28:12.402 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-06-23 12:27:31
任务结束时刻                    : 2021-06-23 12:28:12
任务总计耗时                    :                 41s
任务平均流量                    :            1.65MB/s
记录写入速度                    :          26214rec/s
读出记录总数                    :             1048576
读写失败总数                    :                   0channel并发3个未生效

数据分片后

2021-06-23 12:59:01.629 [job-0] INFO  JobContainer - 
任务启动时刻                    : 2021-06-23 12:58:29
任务结束时刻                    : 2021-06-23 12:59:01
任务总计耗时                    :                 31s
任务平均流量                    :            2.20MB/s
记录写入速度                    :          34952rec/s
读出记录总数                    :             1048576
读写失败总数                    :                   0

速度相比数据分片前提升了10s

同步日志,相比数据分片前做了数据分片处理,并发3个channel处理16个任务。
channel并发3个未生效
在这里插入图片描述

2021-06-23 12:58:31.020 [job-0] INFO  JobContainer - jobContainer starts to do prepare ...
2021-06-23 12:58:31.020 [job-0] INFO  JobContainer - DataX Reader.Job [oraclereader] do prepare work .
2021-06-23 12:58:31.020 [job-0] INFO  JobContainer - DataX Writer.Job [mysqlwriter] do prepare work .
2021-06-23 12:58:31.021 [job-0] INFO  JobContainer - jobContainer starts to do split ...
2021-06-23 12:58:31.021 [job-0] INFO  JobContainer - Job set Channel-Number to 3 channels.
2021-06-23 12:58:31.113 [job-0] INFO  SingleTableSplitUtil - split pk [sql=SELECT * FROM ( SELECT IDNO FROM DBTEST.OTBS1 SAMPLE (0.1)  WHERE (IDNO IS NOT NULL)  ORDER BY DBMS_RANDOM.VALUE) WHERE ROWNUM <= 15 ORDER by IDNO ASC] is running... 
2021-06-23 12:58:31.389 [job-0] INFO  SingleTableSplitUtil - After split(), allQuerySql=[
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (42075 <= IDNO AND IDNO < 77408) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (77408 <= IDNO AND IDNO < 187833) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (187833 <= IDNO AND IDNO < 263631) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (263631 <= IDNO AND IDNO < 349253) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (349253 <= IDNO AND IDNO < 364994) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (364994 <= IDNO AND IDNO < 434398) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (434398 <= IDNO AND IDNO < 437250) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (437250 <= IDNO AND IDNO < 516705) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (516705 <= IDNO AND IDNO < 555961) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (555961 <= IDNO AND IDNO < 578695) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (578695 <= IDNO AND IDNO < 638120) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (638120 <= IDNO AND IDNO < 655685) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (655685 <= IDNO AND IDNO < 859873) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  (859873 <= IDNO AND IDNO <= 962533) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  ((IDNO < 42075) OR (962533 < IDNO)) 
select IDNO,COL1,COL2,COL3,DT,COL5,COL6,COL7,COL8,COL9,COL10 from TEST.OTBS1  where  IDNO IS NULL
].
2021-06-23 12:58:31.390 [job-0] INFO  JobContainer - DataX Reader.Job [oraclereader] splits to [16] tasks.
2021-06-23 12:58:31.394 [job-0] INFO  JobContainer - DataX Writer.Job [mysqlwriter] splits to [16] tasks.
2021-06-23 12:58:31.431 [job-0] INFO  JobContainer - jobContainer starts to do schedule ...
2021-06-23 12:58:31.460 [job-0] INFO  JobContainer - Scheduler starts [1] taskGroups.
2021-06-23 12:58:31.463 [job-0] INFO  JobContainer - Running by standalone Mode.
2021-06-23 12:58:31.487 [taskGroup-0] INFO  TaskGroupContainer - taskGroupId=[0] start [3] channels for [16] tasks.
2021-06-23 12:58:31.508 [taskGroup-0] INFO  Channel - Channel set byte_speed_limit to -1, No bps activated.
2021-06-23 12:58:31.508 [taskGroup-0] INFO  Channel - Channel set record_speed_limit to -1, No tps activated.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/517984.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flink 1.9 实战:使用 SQL 读取 Kafka 并写入 MySQL

上周六在深圳分享了《Flink SQL 1.9.0 技术内幕和最佳实践》&#xff0c;会后许多小伙伴对最后演示环节的 Demo 代码非常感兴趣&#xff0c;迫不及待地想尝试下&#xff0c;所以写了这篇文章分享下这份代码。希望对于 Flink SQL 的初学者能有所帮助。完整分享可以观看 Meetup 视…

java的基础语法和数据类型,IDEA

IDEA的用法 快捷方法 主函数&#xff1a;psvm输出语句&#xff1a;sout java基础语法注释 注释&#xff1a;必须要写注释 单行注释&#xff1a;//多行注释&#xff1a;/**/文档注释javaDoc&#xff1a;/***/ 平时写代码要注意规范 标识符和关键字 所有标识符应该都以字母&…

手把手教你配置VS Code 远程开发工具,工作效率提升N倍

来源 | 后端技术学堂责编 | Carol封图 | CSDN 付费下载于视觉中国今天和大家分享一个远程开发解决方案&#xff0c;聊一聊我平常是如何用 VS Code 进行远程开发工作的&#xff0c;以及一步步教你搭建远程开发环境&#xff0c;拥有比德芙还丝滑的远程开发体验。我们厂里为了最大…

蚂蚁金服隗华:十五年时间见证分布式数据库的崛起

北大计算所启蒙 “做中国人自己的技术” 如果用一句话来评价读书时的隗华&#xff08;花名&#xff1a;风羿&#xff09;&#xff0c;那一定是“德智体美劳全面发展的好学生”。本科在北航读的计算机专业&#xff0c;硕士则就读于北大的计算机研究所。 北大&#xff0c;中国高…

用户数从 0 到亿,我的 K8s 踩坑血泪史

导读&#xff1a;容器服务 Kubernetes 是目前炙手可热的云原生基础设施&#xff0c;作者过去一年上线了一个用户数极速增长的应用&#xff1a;该应用一个月内日活用户从零至四千万&#xff0c;用户数从零到一亿的裂变式增长&#xff0c;充分享受了容器服务快速简便的扩容操作和…

行,Python玩大了!​取代Excel,程序员:太牛!你怎么看?

Python真的玩大了吗&#xff1f;2020年&#xff0c;Python程序员究竟怎么样&#xff1f;A与B程序员与远方近日日本最大的证券公司之一野村证券首席数字官马修汉普森&#xff0c;在Quant Conference上发表讲话&#xff1a;“用Excel的人越来越少&#xff0c;大家都在用Python。”…

云原生计算重塑企业IT架构 - 分布式应用架构

进入21世纪以来&#xff0c;我们见证了企业分布式应用架构从SOA(Service-oriented Architecture)&#xff0c;到微服务架构&#xff0c;再到云原生应用架构的演化。 为了说明企业架构演化背后的思考&#xff0c;我们先谈一些玄学。 第一&#xff0c;企业IT系统的复杂性&#…

首发!《长安十二时辰背后的技术秘籍》正式公开,速来下载

一名死囚如何在十二时辰内利用“唐代黑科技”&#xff0c;拯救长安百姓于水火中&#xff1f; 这就是《长安十二时辰》的故事&#xff0c;剧中有恢弘的长安美景、让人流口水的水晶柿子/水盆羊肉&#xff0c;还有张小敬和檀棋“在一起”呼声……然而&#xff0c;最让人刮目相看的…

ETL异构数据源Datax_MySQL同步Oracle(全量)_07

文章目录1. 清除Oracle数据库中OTBS1表的数据2. 构建json3. 执行脚本4. 同步验证5. 同步分析7. 同步结果1. 清除Oracle数据库中OTBS1表的数据 Truncate TABLE OTBS1;2. 构建json {"core": {"transport": {"channel": {"speed": {&qu…

左手代码右手滑板 支付宝这个程序员有些酷

走在杭州支付宝z空间的园区&#xff0c;常常可以看到一个脚踩滑板&#xff0c;脑后扎个发髻的男青年。 他叫边柳。来蚂蚁金服三年&#xff0c;除了是一名前端码农&#xff0c;也是一位斜杠青年。捧着程序员的“饭碗”&#xff0c;兼顾着滑板和摇滚的爱好&#xff0c;可以说他过…

2019阿里云910会员节大促主会场全攻略

2019阿里云910会员大促活动已经于8月28日正式开启&#xff0c;从已开放的活动页面来看&#xff0c;整场大促活动由阿里云10年有礼时光机、爆款产品推荐、七大分会场组成。 在910这个秋季大幅度优惠促销日&#xff0c;怎样才能花最少的钱配置最特惠的云服务&#xff1f;云栖社区…

浪潮商用机器与腾讯TDSQL完成互认证 共同拓展Power行业生态

日前&#xff0c;浪潮商用机器有限公司宣布&#xff0c;旗下K1 Power服务器系列产品经过几十项基础功能和高可用功能用例的专业测试&#xff0c;与腾讯新兴国产分布式数据库TDSQL完美兼容&#xff0c;且性能优异&#xff0c;可进行顺利的部署、平稳的运行及对外提供服务。此次互…

历时五天用 SwiftUI 做了一款 APP,阿里工程师如何做的?

作者|姜沂(倾寒) 出品|阿里巴巴新零售淘系技术部 导读&#xff1a;自 2014 年苹果发布会发布 Swift 之后, Swift 经过多年迭代&#xff0c;终于达到了 ABI 稳定版本&#xff0c;也意味着 Swift 做为稳定的得语言&#xff0c;值得用在大型 APP&#xff0c; 用来生产环境中。 2…

Istio从懵圈到熟练 – 二分之一活的微服务

Istio is the future&#xff01;基本上&#xff0c;我相信对云原生技术趋势有些微判断的同学&#xff0c;都会有这个觉悟。其背后的逻辑其实是比较简单的&#xff1a;当容器集群&#xff0c;特别是K8S成为事实上的标准之后&#xff0c;应用必然会不断的复杂化&#xff0c;服务…

数据结构与算法、讲解、动态规划一脸懵?看完之后轻松掌握!

来源 | 昊天码字责编 | Carol封图 | CSDN 付费下载于视觉中国碰到动态规划问题摸不着头脑&#xff1f;总结不出动态规划的类型&#xff1f;有多少人曾经历过这种迷茫与无助&#xff1f;看完本文&#xff0c;让你一脚迈进动态规划的大门。我们在用递归求解问题的过程中&#xff…

搜索场景下的智能推荐演变之路

摘要&#xff1a;传统的推荐手段主要还是深度挖掘用户行为和内容本身相似性的价值&#xff0c;包括但不限于协同过滤&#xff0c;内容表征向量召回&#xff0c;以及各式各样的点击率预估模型&#xff0c;然后这样的推荐行为缺乏内在的逻辑性和可解释性&#xff0c;有一种知其然…

调查了 17,000 多位程序员,当前的云原生开发现状究竟如何?

整理 | 弯月&#xff0c;责编 | 郭芮头图 | CSDN 下载自东方IC出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;容器的标准化使用改变了软件的开发方式&#xff0c;我们迎来了开发运维的时代&#xff0c;基于云原生的开发能够帮助我们构建更灵活、更强大的应用程序。…

阿里研究员:测试稳定性三板斧,我怎么用?

阿里妹导读&#xff1a;如何治理测试稳定性问题&#xff1f;很多人会说&#xff1a;环境、流程管控、监控、工具化、加机器、专人负责、等等。这些都是对的。不过这些都是解决方案层面的&#xff0c;而不是方法论和理论体系层面的。今天&#xff0c;阿里研究员郑子颖来说说测试…

阿里架构总监一次讲透中台架构,13页PPT精华详解,建议收藏!

本文整理了阿里几位技术专家&#xff0c;如架构总监 谢纯良&#xff0c;中间件技术专家 玄难等几位大牛&#xff0c;关于中台架构的几次分享内容&#xff0c;将业务中台形态、中台全局架构、业务中台化、中台架构图、中台建设方法论、中台组织架构、企业中台建设实施步骤等总共…

Redis 6.0 的客户端缓存是怎么肥事?一文带你了解!

来源 | 程序员历小冰责编 | Carol封图 | CSDN 付费下载于视觉中国近日 Redis 6.0.0 GA 版本发布&#xff0c;这是 Redis 历史上最大的一次版本更新&#xff0c;包括了客户端缓存 (Client side caching)、ACL、Threaded I/O 和 Redis Cluster Proxy 等诸多更新。我们今天就依次聊…