Kettle学习(8)

来源:网络收集 时间:2025-08-22 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xuecool-com或QQ:370150219 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

Abort(中止)

这个步骤允许你在观察输入的时候中止步骤。它的主要用途是错误处理,在一定数量行流过错误的连接时中止转换。

1、 失败阙值:中止转换开始行数。如果设置为0,在第一行的时候,步骤将被中止。 2、 失败消息:中止的时候放入日志文件的消息,如果没有输入就使用缺省消息。 3、 总是记录行数:中止步骤总是记录处理的行数。

Oracle Bulk Loader(Oracle 批量装载)

这个步骤允许你大批量加载数据到Oracle数据库,它将用一个正确的装载格式,然后调用Oracle的SQL*Loader数据加载工具加载到指定的表中。

1、 Target schema:写入数据的表的schema名称,表名中可以包含“.” 2、 Sqllder(loader) path:sql*Loader数据加载工具的全路径。 3、 Loader method(装载方式):Automatic load 和manual load。如果是自动加载,步骤将

在用指定的参数收到所有的输入后运行Sqlldr工具。如果是手动加载,将生成一个可以作为后门使用的控制和数据文件。 4、 Loader action(加载动作):Append、Insert、Replace、Truncate,这些会映射到sqlldr的

动作来执行。

5、 Maximum errors:发生错误的最大行数,这时sqlldr将被中断。与sqlldr的“ERROR”属

性来通信。

6、 Commit:提交的行数,与sqlldr的“ROWS”属性通信。 7、 Bind(绑定) Size:与sqlldr的“BINDSIZE”属性通信。 8、 Read Size:与sqlldr的“READSIZE”属性通信。 9、 Control file:sqlldr控制文件的名称。 10、 Data file:数据将被写入的数据文件的名称。 11、 Log file:日志文件的名称,可选。 12、 Bad file:坏文件的名称,可选。 13、 Discard(废) file:废文件的名称,可选。 14、 Encoding:数据指定的编码格式。 15、 Direct path(直接路径):直接路径加载的开关,与sqlldr的“DIRECT=TRUE”通信。 16、 Erase cfg/dat files after(使用后删除cfg/dat文件):加载后是否删除控制文件和数

据文件的开关。 17、 Table field:Oracle表中加载的表字段。 18、 Stream field:输入行中带来的字段。

31 / 42

===================================

Job===================================

32 / 42

任务设置(Job Settings)未找到 任务条目(Job Entries)未找到 Start

Start是任务执行的入口,首先必须是任务可以执行。只有无条件的任务条目可以从Start入口连接。Start图标也包含基本的进度安排功能,如果你编辑此条目,你可以得到以下屏幕:

Dummy(假程序/沉默)

在一个任务中使用Dummy条目讲什么也不做,这可以是一个任务更清晰战士,或者在执行循环中使用。

Success

如果任务得上一个条目错误数量为0,则返回true,否则返回false

Transformation(转换)

你可以用一个转换任务条目执行一个先前定义的转换。

1、 Job名称:任务条目的名称,在单个任务中,必须唯一。在执行结果处任务/任务条目处

显示。

2、 转换名称:需要运行的转换的名称。转换可以没有名称,但不能没有转换文件名。 3、 资源库路径:指定资源库目录。

4、 转换文件名:如果你不是使用资源库工作,就指定转换运行的XML文件名。 5、 指定日志文件:检查是否为转换指定一个单独的日志文件。

6、 日志文件名、日志文件扩展名、日志文件包含日期?、日志文件包含时间?日志级别

33 / 42

7、 复制以前结果单参数:上一次的转换结果复制到参数中 8、 执行每一个输入行:即每个输入行都执行一次。

9、 在执行前清除结果行列表:在转换运行之前,检查确保列表或者结果行已经被清除。 10、 执行前清除结果文件列表:在转换运行之前,检查确保列表或者结果文件已经被清

除。

Job

你可以使用job条目来运行一个先前定义的任务。 1、 作业项名称:job条目名称。

2、 作业名称:需要运行的任务的名称。 3、 资源库目录:指定资源库目录。

4、 作业文件名:如果你不是使用资源库工作,就指定转换运行的XML文件名。

5、 指定日志文件、追加日志文件、日志文件名、扩展名、包含日期、包含时间、日志级别 6、 将上一结果作为参数:将上一条目结果作为参数。 7、 对每个输入行执行一次:对每个输入行都执行一次

Shell

你可以使用Shell任务条目在任务运行的主机上执行一段Shell脚本。 备注:Shell脚本能在控制台窗口输出文本,输出将转换到Kettle日志系统,这不会影响Shell脚本的运行。 1、 作业项名称:

2、 Insert Script:插入脚本。

3、 脚本文件名:要运行的Shell脚本文件名。

4、 指定日志文件:检查是否为Shell脚本指定一个单独的日志文件。

Mail(Port:25)

你可以使用Mail任务条目来发送E-mail。 1、 邮件作业名称

2、 目的地址(Destination Address): 3、 抄送(CC=Carbon Copy):

4、 暗送(BCc=Blind CarbonCopy): 5、 SMTP 服务器、端口号

6、 用户验证(Use authentication)、用户名、密码 7、 联系人、联系电话

8、 带附件:是否带有附件。

9、 压缩成统一文件格式:是否需要压缩所有选择的文件到归档文件中。 10、 压缩文件名称:指定压缩后文件名称。

34 / 42

SQL

执行SQL语句。

FTP

你可以使用FTP任务条目从FTP服务器上获取一个或者多个文件。 常用协议端口号:HTTP(TCP):80;SMTP:25;FTP:21; TCP/IP协议:接口层、网络层(IP)、传输层(TCP、UDP)、应用层(HTTP) 1、 FTP服务器名称/IP地址: 2、 Server Port:21 3、 用户名、密码

4、 代理服务器:代理服务器IP

5、 代理服务器端口:代理服务器端口号 6、 代理服务器用户名、密码

7、 二进制模式:如果文件需要使用二进制模式,选中此项。 8、 超时:FTP服务器超时时间。

9、 使用活动的FTP连接:使用主动的FTP,以代替被动模式(默认)。 10、 控制编码:ftp控制指令的编码。 11、 远程目录:从服务器获取文件的远程目录。 12、 通配符(正则表达式):如果想选择多个文件,指定一个正则表达式。 13、 获取后删除文件:从ftp服务器获取文件后,删除原文件。 14、 目标目录:本机存放文件的目录。 15、 不覆盖文件:如果指定目标目录文件名已经存在则跳过文件。 备注:如果文件包含某些字符(spaces e.g.[例如])

Table Exists

你可以使用Table exists任务条目检验数据库中是否存在某个表。任务条目返回的结果只有成功失败。

File exists

你可以使用File exists任务条目检验在Kettle运行的服务器上是否存在某个文件。 1、 变量:使用变量作为文件名。

Javascript

你可以使用该任务条目来计算一个布尔型的变量,这个变量可以在决定下一个步骤是否将被执行时使用。用户可以使用一下变量: 1、 Errors:先前的任务条目的错误数。

35 / 42

百度搜索“70edu”或“70教育网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,70教育网,提供经典教育范文Kettle学习(8)在线全文阅读。

Kettle学习(8).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.70edu.com/fanwen/1069329.html(转载请注明文章来源)

相关推荐:

Copyright © 2020-2025 70教育网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:370150219 邮箱:370150219@qq.com
苏ICP备16052595号-17
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:7 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219