Kettle安装和使用
安装
安装之前需要准备的环境为Java环境,需要提前配置好jdk
下载之后,解压即可使用。
使用
1.因为该工具主要是对数据库进行操作,所以需要提前将mysql的jar包放到lib文件夹下边。
2.使用可视化图形界面,双击运行
初始界面如下:
这两个分别是转换和作业两个类型,下面举例对这两个进行简单的应用。
操作举例
转换操作
目标:将数据表stu1中的数据,转移到数据表2中,如果2中有相同的id则覆盖。如果没有则插入到数据表中。
数据准备:
stu1表
stu2表
双击转换进入新界面
在输入中选择:表输入
在输出中选择:插入/更新
然后按住shift使用鼠标将两个节点连接起来。
如下图:
b)双击表输入:
填写对应的连接参数,本例子以mysql为例
设置新的连接参数,填写完成之后点击测试,成功之后点击确定。
c)在sql处填写sql语句
Select * from stu1
可以点击下方预览,查看当前表中数据
点击确定退出。
d)
双击插入/更新
选择目标表:找到stu2,点击确定
然后如图
第三步操作如图(去掉不匹配的字段)
因为我们的目标是对id为标准进行插入更新。所以需要将其他几个字段在查询关键字列表中删除。
更新字段中,我们要将id的更新设置为N,因为id为查找依据,所以不能更新id。
操作完成之后点击确定,然后执行即可。
成功标志如下:
作业操作
新建,作业,
添加如下,start和转换在通用目录下,sql在脚本目录下。
双击转换选择之前第一步存储的job
然后双击sql,新建连接
在sql下写入sql语句
insert into stu2 values(5,'5')
点击执行,运行成功。
该过程主要目的是定时对数据表进行更新,可以设置周期为一天或者一周等。
时间间隔的设置方式为双击start。