datax在win10中的安装


datax安装需要的环境

JDK(1.8以上,推荐1.8)
Python(推荐Python2.7.X)
Apache Maven 3.x (Compile DataX)

这里只讲下python的安装和配置

python

python官网下载

https://www.python.org/downloads/windows/

我这里下载的是2.7,傻瓜式安装(默认C盘,注意修改安装路径)

安装成功后,配置环境变量(3.0版本以上的会自动配置)

在path中新增python的安装路径(例:C:\python27

测试是否安装成功

cmd ==> 输入python,出现版本号即配置成功

datax安装

 1.datax安装包

下载地址:

http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz

下载后解压至本地某个目录,进入bin目录

我本地解压的路径(E:\datax\datax\bin)

2.测试datax

windows+R ==> 输入cmd,回车进入命令提示符界面

依次输入

e:

cd E:\datax\datax\bin  (cd后是自己解压datax的bin路径)

自检脚本

python  datax.py  ../job/job.json

 最后出现以下页面即表明安装成功

 如果出现乱码

 在自检脚本前运行 CHCP 65001

 再次执行 python  datax.py  ../job/job.json 即不再乱码

3.问题修复

在执行 python  datax.py  ../job/job.json 时可能会出现以下报错:

2022-04-01 23:22:10.153 [main] WARN  ConfigParser - 插件[streamreader,streamwriter]加载失败,1s后重试... Exception:Code:[Common-00], Describe:[您提供的配置文件存在错误信息,请检查您的作业配置 .] - 配置信息错误,
您提供的配置文件[/opt/datax/plugin/reader/._drdsreader/plugin.json]不存在. 请检查您的配置文件.
2022-04-01 23:22:11.157 [main] ERROR Engine -

经DataX智能分析,该任务最可能的错误原因是:
com.alibaba.datax.common.exception.DataXException: Code:[Common-00], Describe:[您提供的配置文件存在错误信息,请检查您的作业配置 .] - 配置信息错误,您提供的配置文件[/opt/datax/plugin/reader/._drdsreader/plugin.json]不存在. 请检查您的配置文件.
        at com.alibaba.datax.common.exception.DataXException.asDataXException(DataXException.java:26)
        at com.alibaba.datax.common.util.Configuration.from(Configuration.java:95)
        at com.alibaba.datax.core.util.ConfigParser.parseOnePluginConfig(ConfigParser.java:153)
        at com.alibaba.datax.core.util.ConfigParser.parsePluginConfig(ConfigParser.java:125)
        at com.alibaba.datax.core.util.ConfigParser.parse(ConfigParser.java:63)
        at com.alibaba.datax.core.Engine.entry(Engine.java:137)
        at com.alibaba.datax.core.Engine.main(Engine.java:204)

解决办法

删除reader文件和writer文件夹下的 ._xxx 文件

删除reader目录下的部分文件

 执行下面的命令

del ._hdfsreader 
del ._otsstreamreader 
del ._otsreader 
del ._txtfilereader 
del ._ftpreader 
del ._streamreader 
del ._odpsreader 
del ._cassandrareader 
del ._hbase11xreader 
del ._oraclereader 
del ._postgresqlreader 
del ._mysqlreader 
del ._rdbmsreader 
del ._mongodbreader 
del ._ossreader 
del ._sqlserverreader 
del ._hbase094xreader
del ._drdsreader 

删除writer目录下的部分文件

 执行下面的命令

del ._hbase11xsqlwriter
del ._ocswriter 
del ._adswriter 
del ._drdswriter
del ._hbase11xwriter 
del ._hbase094xwriter 
del ._sqlserverwriter 
del ._osswriter 
del ._mongodbwriter 
del ._rdbmswriter 
del ._mysqlwriter 
del ._postgresqlwriter 
del ._oraclewriter 
del ._cassandrawriter 
del ._odpswriter 
del ._streamwriter 
del ._ftpwriter 
del ._txtfilewriter 
del ._otswriter 
del ._hdfswriter

此时进入bin目录执行自检脚本,可正常启动

python  datax.py  ../job/job.json