DataX安装 一、简介二、系统要求三、部署 一、简介 官方地址:https://github.com/alibaba/DataX/blob/master/userGuid.md 二、系统要求 LinuxJDK(1.8以上,推荐1.8) Centos7.9的java1.8安装命令:yum install java-1.8.0-openjdk.x86_64 Python(2或3都可以)Apache Maven 3.x (Compile DataX) 三、部署 下载工具包:https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202309/datax.tar.gz 文件大约有1.6G 我的部署环境:Centos7.9 # 1.下载后,任意文件夹下可以解压,我解压到/data/ tar -zxvf datax.tar.gz -C /data # 2.运行自检脚本 python /data/datax/bin/datax.py /data/datax/job/job.json 解压后文件夹作用: bin:包含可执行的命令文件,用于启动和运行 DataX 工具。conf:存放配置文件,包括数据源配置、作业配置等,用户可以在这里进行配置以定义数据传输任务的参数和规则。job:存放数据传输的作业配置文件,每个作业对应一个 JSON 或者其他格式的配置文件,描述了数据抽取、转换、加载等任务的具体流程和规则。lib:存放 DataX 运行所需的依赖库文件,包括一些数据源的驱动程序、插件等。plugin:存放数据源相关的插件,例如数据库插件、文件系统插件等,用于支持不同类型数据源的数据传输。script:存放 DataX 的执行脚本文件,用于启动 DataX 工具并执行数据传输任务。tmp:临时文件夹,可能会用于存放临时生成的数据或者中间结果。