ETL异构数据源Datax_部署前置环境_01

文章目录

          • 一、概述
            • 1. 是什么?
            • 2. 开源地址
          • 二、简介
            • 2.1. 设计架构
            • 2.2. 框架结构
          • 三、检查环境
            • 3.1. 检验是否安装JDK(1.8以上,推荐1.8)
            • 3.2. 检验是否安装python环境,要求2.6=<版本
            • 3.3. maven环境
          • 四、JDK环境安装
            • 4.1. rpm方式安装
            • 4.2. gz方式安装
          • 五、python环境安装
            • 5.1. python 最新版下载
            • 5.2. python 下载指定版本
            • 5.3. python 安装

一、概述
1. 是什么?

DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。

2. 开源地址

https://github.com/alibaba/DataX

######3. DataX下载地址
http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz

二、简介
2.1. 设计架构

在这里插入图片描述

数据交换通过DataX进行中转,任何数据源只要和DataX连接上即可以和已实现的任意数据源同步

2.2. 框架结构

在这里插入图片描述

核心组件:
    Reader:数据采集模块,负责从源采集数据
    Writer:数据写入模块,负责写入目标库
    Framework:数据传输通道,负责处理数据缓冲等
    以上只需要重写Reader与Writer插件,即可实现新数据源支持
  支持主流数据源,详见https://github.com/alibaba/DataX/blob/master/introduction.md
  从一个JOB来理解datax的核心模块组件:
    datax完成单个数据同步的作业,称为Job,job会负责数据清理、任务切分等工作;
    任务启动后,Job会根据不同源的切分策略,切分成多个Task并发执行,Task就是执行作业的最小单元
    切分完成后,根据Scheduler模块,将Task组合成TaskGroup,每个group负责一定的并发和分配Task

三、检查环境
3.1. 检验是否安装JDK(1.8以上,推荐1.8)
java -version

在这里插入图片描述

3.2. 检验是否安装python环境,要求2.6=<版本
python

在这里插入图片描述

3.3. maven环境

Apache Maven 3.x (Compile DataX)

源码编译环境

Linux环境安装并配置Maven

四、JDK环境安装

安装方式任选其一

4.1. rpm方式安装
安装jdk
rpm -ivh jdk-8u271-linux-x64.rpm#设置环境变量
export JAVA_HOME=/usr/java/jdk1.8.0_271-amd64
export PATH=$JAVA_HOME/bin:$PATH
source .bash_profilejava -version
4.2. gz方式安装

CentOS 7 安装jdk

五、python环境安装

Python(推荐Python2.6.X=<版本)

5.1. python 最新版下载

官网:https://www.python.org/downloads/

声明:请根据系统环境下载

在这里插入图片描述

5.2. python 下载指定版本

根据需求下载即可
在这里插入图片描述
Python-2.7.18.tgz下载地址:
https://www.python.org/downloads/release/python-2718/
在这里插入图片描述

5.3. python 安装
#上传服务器指定目录
根据需求而定#解压
cd /app
tar -zxvf Python-2.7.18.tgz#指定安装目录
./configure --prefix=/usr/local/python-2.7.18#编译
make#安装
make install#加入环境变量
vi .bash_profile
export PATH=/usr/local/python-2.7.18/bin:$PATH#刷新环境变量
source .bash_profile#验证
python

操作记录:

[root@localhost ~]# python
Python 2.7.5 (default, Aug  7 2019, 00:51:29) 
[GCC 4.8.5 20150623 (Red Hat 4.8.5-39)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/518018.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI 玩王者荣耀狂上分!打了六局,心态崩了

你造吗&#xff1f;人工智能继进军围棋之后&#xff0c;又来我“王者峡谷”了。腾讯AI LAB与王者荣耀合作开发的AI【绝悟】&#xff0c;在最高规格赛事中获胜&#xff0c;宣布已达到“电竞职业水平”&#xff01;据称&#xff1a;【绝悟】一天的训练强度&#xff0c;高达人类44…

MFC 工具栏

目录 工具栏概述 工具栏的使用 添加工具栏资源 创建&#xff0c;加载工具栏 设置工具栏停靠 工具栏概述 CToolBarCtrl-父类CWnd&#xff0c;封装了关于工具栏控件的各种操作。 CToolBar一父类CControlBar&#xff0c;封装了关于工具栏的操作&#xff0c;以及和框架窗口的…

在SLS中快速实现异常巡检

一、相关算法研究 1.1 常见的开源算法 Yahoo&#xff1a;EGADSFaceBook&#xff1a;ProphetBaidu&#xff1a;OpprenticeTwitter&#xff1a;Anomaly DetectionRedhat&#xff1a;hawkularAliTsinghua&#xff1a;DonutTencent&#xff1a;MetisNumenta&#xff1a;HTMCMU&…

可能是你见过最完善的微前端解决方案

Techniques, strategies and recipes for building a modern web app with multiple teams using different JavaScript frameworks.—— Micro Frontends 前言 TL;DR 想跳过技术细节直接看怎么实践的同学可以拖到文章底部&#xff0c;直接看最后一节。 目前社区有很多关于微…

金山云纳斯达克敲钟上市 不负时代的机遇

5月8日&#xff0c;中国知名的独立云服务商金山云正式在美国纳斯达克挂牌交易&#xff0c;股票代码 “KC”。 金山云依托广泛的云基础架构&#xff0c;通过提供先进可信赖的云服务&#xff0c;为各行业定制了结构完善的解决方案&#xff0c;在中国云计算市场取得了领先地位&am…

前沿 | VLDB论文解读:阿里云超大规模实时分析型数据库AnalyticDB

前言 一年一度的数据库领域顶级会议VLDB 2019于美国当地时间8月26日-8月30日在洛杉矶召开。在本届大会上&#xff0c;阿里云数据库产品团队多篇论文入选Research Track和Industrial Track。 本文将对入围Industrial Track的论文《AnalyticDB: Realtime OLAP Database System at…

第一个Java

Hello World 随便创一个文件夹&#xff0c;储存代码 新建一个Java文件 文件后缀名.javaHello.java[注意]系统可能没有显示后缀名&#xff0c;需要手动打开 编写代码 public class Hello{public static void main(String[] args){System.out.print("Hello Wold");…

Teradata天睿公司任命Steve McMillan为总裁兼首席执行官

Teradata天睿公司日前宣布&#xff0c;公司董事会已经任命Steve McMillan担任总裁兼首席执行官以及董事会成员&#xff0c;自2020年6月8日起生效。McMillan先生曾在F5 Networks公司担任全球服务执行副总裁&#xff0c;未来将接任临时总裁兼首席执行官Victor Lund&#xff0c;在…

蚂蚁金服在云原生架构下的可观察性的探索和实践

本文根据 8 月 11 日 SOFA Meetup#3 广州站 《蚂蚁金服在云原生架构下的可观察性的探索和实践》主题分享整理。现场回顾视频以及 PPT 查看地址见文末链接。 前言 随着应用架构往云原生的方向发展&#xff0c;传统监控技术已经不能满足云原生时代运维的需求&#xff0c;因此&am…

Docker启动Mysql容器失败,挂载时权限不足,chown: changing ownership of ‘/var/lib/mysql/‘: Permission denied

文章目录1. 现象2. 查看日志分析3. 提示信息4. 解决方案5. 再次执行成功6. 技巧1. 现象 今天用Docker运行Mysql容器时&#xff0c;一直启动不了&#xff0c;删除了重新制作容器也不行 镜像用的Mysql5.7 运行镜像用的命令行 为: docker run -d --name fxmysql -v /opt/data:/…

如何实现一次编码,到处运行?新一代云端一体化探索

阿里妹导读&#xff1a;当前移动互联网业务研发运维模式&#xff0c;云与多端互相割裂&#xff0c;有些全栈的探索缺乏成功案例&#xff0c;行业对云端一体化研发这块仍是空白&#xff0c;我们要思考&#xff1a;如何能实现 1 个研发支撑云 android iOS 三端的业务快速落地&a…

这份操作系统词典请查收!

作者 | cxuan责编 | 郭芮头图 | CSDN 下载自东方 IC1. 操作系统&#xff08;Operating System&#xff0c;OS&#xff09;&#xff1a;是管理计算机硬件与软件资源的系统软件&#xff0c;同时也是计算机系统的内核与基石。操作系统需要处理管理与配置内存、决定系统资源供需的优…

使用javax.mail发送邮件

文章目录一、发邮件流程二、关于邮件协议和端口三、开启邮件协议和端口3.1. QQ邮箱3.2. 163邮箱四、实战发送邮件4.1. 引入依赖4.2. 方法重写4.3. 发送邮件核心类工具类EmailUtils五、QQ邮件发送测试5.1. QQ发送测试5.2. 查看QQ发送邮箱5.3. 查看收件人收件箱六、163邮件发送测…

导入Oracle 数据库镜像,创建Oracle虚拟机_01

文章目录1. 创建虚拟机&#xff0c;选择镜像2. 调整内存大小3. 调整处理器大小1. 创建虚拟机&#xff0c;选择镜像 2. 调整内存大小 3. 调整处理器大小 接下一篇&#xff1a;plsql连接 oracle instantclient_11_2 本地机器不安装oracle_02 https://gblfy.blog.csdn.net/article…

阿里技术专家详解 DDD 系列- Domain Primitive

导读&#xff1a;对于一个架构师来说&#xff0c;在软件开发中如何降低系统复杂度是一个永恒的挑战&#xff0c;无论是 94 年 GoF 的 Design Patterns &#xff0c; 99 年的 Martin Fowler 的 Refactoring &#xff0c; 02 年的 P of EAA &#xff0c;还是 03 年的 Enterprise …

别傻了,90%的开发者都没有做好它

上周末和在北京的哥们国仔涮火锅&#xff0c;席间聊起了最近面试的经历。他说想换工作的原因很简单&#xff0c;就是要涨工资&#xff0c;原来的公司呆了两年多&#xff0c;薪资浮动不超过 500 元。而身边跳槽的那些同事&#xff0c;薪资都已经是自己的 2 倍了。在准备面试的过…

是真“开发者”,就来一“测”到底!

阿里云开发者虚拟勋章 云时代是开发者的天下&#xff01; 云让稳定、安全、高效的计算能力得到普惠&#xff0c;服务于广大开发者的同时&#xff0c;也对开发者不断学习、掌握技术知识提出了更高的要求。 阿里云推出的开发者学测服务&#xff0c;通过简单、便捷的形式&#x…

plsql连接 oracle instantclient_11_2 本地机器不安装oracle_02

接上一篇:导入Oracle 数据库镜像&#xff0c;创建Oracle虚拟机_01 https://blog.csdn.net/weixin_40816738/article/details/118115668 文章目录一、本地安装二、instantclient_11_2配置声明&#xff1a;&#xff08;本地环境不需要安装oracle客户端&#xff09; 一、本地安装 …

结构化数据存储,如何设计才能满足需求?

阿里妹导读&#xff1a;任何应用系统都离不开对数据的处理&#xff0c;数据也是驱动业务创新以及向智能化发展最核心的东西。数据处理的技术已经是核心竞争力。在一个完备的技术架构中&#xff0c;通常也会由应用系统以及数据系统构成。应用系统负责处理业务逻辑&#xff0c;而…

触发死锁怎么办?MySQL 的死锁系列:锁的类型以及加锁原理了解一下!

来源 | 程序员历小冰责编 | Carol封图 | CSDN 付费下载于视觉中国疫情期间在家工作时&#xff0c;同事使用了 insert into on duplicate key update 语句进行插入去重&#xff0c;但是在测试过程中发生了死锁现象:ERROR 1213(40001): Deadlock found when trying to getlock; t…