[Kettle] Excel输入

Excel文件采用表格的形式,数据显示直观,操作方便

Excel文件采用工作表存储数据,一个文件有多张不同名称的工作表,分别存放相同字段或不同字段的数据

数据源

物理成绩(Kettle数据集2).xls icon-default.png?t=N7T8https://download.csdn.net/download/Hudas/88509178?spm=1001.2014.3001.5501

1. 建立【Excel输入】转换工程

使用Ctrl+N快捷键,创建【转换1】转换工程,单击【核心对象】选项卡,展开【输入】对象,选中【Excel输入】组件,并拖曳到右边工作区中,如下图所示

2. 设置【Excel输入】组件参数

双击【Excel输入】组件,弹出【Excel输入】对话框,其中显示默认的【文件】对话框,如下图所示

需要注意的是,【Excel输入】对话框下方的【预览记录】按钮是灰色的,表示不能单击该按钮

在【Excel输入】对话框中,包含组件的基础参数,以及【文件】【工作表】【内容】【错误处理】【字段】【其他输出字段】6个选项卡的参数

【文件】【工作表】【字段】选项卡的参数是必填项 (没有设置参数时,选项卡名称前面会显示""符号,表示是必填项,设置参数后""符号会消失),并且必须按照【文件】【工作表】【字段】选项卡的顺序设置,其他为可选项

【文件】选项卡参数

在【文件】选项卡参数的说明如下表所示

参数名称

说明

表格类型(引擎)

表示Excel文件的表格类型,类型如下
Excel 97-2003 XLS:JXL软件后端提供向后兼容类型
Excel 2007 XLSX (Apache POI):读取所有已知的Excel文件类型
Excel 2007 XLSX (Apache POI流):读取大型Excel文件
Open Office ODS:使用ODFDOM引擎读取OpenOffice电子表格
默认为Excel 97-2003 XLS

文件或目录

表示要输入的Excel文件或所在的目录,可以单击【浏览】按钮获取Excel文件或目录。默认值为空

正则表达式

表示使用正则表达式,获取文件相应的Excel文件。使用正则表达式,可以动态匹配获取多个Excel文件。默认值为空
正则表达式(排除)

表示排除型的正则表达式,与正则表达式相反,使用排除型的正则表达式,排除掉匹配文件,而获取不匹配的Excel文件。默认值为空

password

表示读取Excel文件的密码。一些Excel文件有读取密码,因此要输入密码才能获取,默认值为空

文件和目录

表示选中的Excel文件或目录,单击【增加】按钮,读入经过浏览获取的文件和目录
通配符号表示使用通配符号选中Excel文件或目录。配置符合通配符号规则的多个Excel文件
通配符号(排除)表示使用排除性通配符号选中Excel文件或目录。配置符合通配符号(排除)规则外的其他多个Excel文件
要求表示配置所需的源文件的位置
包括子目录表示是否包括子目录的文件
选中的文件

表示选中的Excel文件列表。通过单击【增加】按钮将文件或目录添加到列表中,并进行参数设置,参数有:【文件/目录】【通配符号】【通配符号(排除)】【要求】【包括子目录】等参数,有关参数的说明如下表所示。至少要有一个选中的Excel文件,默认值为空

从前面的步骤获取文件名表示是否从前面组件(步骤)读取文件名,如果选择是,则不用本组件获取Excel文件,而是从前面步骤的组件中读取文件、并保存文件的字段名。默认值为空

在【文件】选项卡中,设置参数,并导入“物理成绩.xls”文件,步骤如下所示

(1) 浏览导入Excel文件

单击【浏览(B)…】按钮,在计算机上浏览并导入“物理成绩.xls”文件,如下图所示

(2) 添加并编辑Excel文件

单击【增加】按钮,将【文件或目录】输入框中的"C:\Users\HP\Desktop\物理成绩.xls"文件,添加至【选中的文件】表中,如下图所示

如果选中的文件有问题,那么单击【删除】或【编辑】按钮,即可对选中的Excel文件进行编辑。其中,单击【选中的文件】表的行号,再单击【删除】按钮,即可删除选中所在行的文件 

(3) 查看被选中的文件名称

单击【显示文件名称…】按钮,弹出【文件读取】对话框,查看被选中读取的文件,如下图所示

重复步骤(1)~(3),可以添加多个Excel文件,并查看读取的文件名称 

提示Tips

另外,如果需要导入同一个目录下的多份名称类似的文件,如导入同一个目录下名称分别为“物理成绩.xls”“物理成绩1.xls”和“物理成绩2.xls”的文件

我们可以使用通配符的方式导入,具体操作是在【选中的文件】参数表中,在【文件/目录】输入框中键入“C:\Users\HP\Desktop\”,在【通配符号】输入框中键入“物理成绩*.\.xls”,可以一次性读入这3个文件,如图所示

【工作表】选项卡参数 

单击【工作表】选项卡,如下图所示

在【要读取的工作表列表】表中设置工作表参数,获取导入的Excel文件的工作表,【工作表】选项卡参数的说明如下表所示

参数名称说明
工作表名称

表示Excel文件的工作表名称。可以是一个Excel文件、多个工作表,也可以是多个Excel文件、多个工作表。不同的文件,工作表名称可以相同。默认值为空

起始行表示要读取的工作表中的开始行,行号是从0开始。默认值为空
起始列表示要读取的工作表中的开始列,列号是从0开始。默认值为空

在【工作表】选项卡中,设置导入的Excel文件的工作表参数,步骤如下所示

(1) 获取选中文件的工作表

单击【获取工作表名称…】按钮,弹出【输入列表】对话框,左边【可用项目】列表列出选中文件的所有工作表,如"物理成绩.xls"文件的"Sheet1"工作表,而右边【你的选择】列表列出被选中的工作表,如图所示

(2)选择工作表

在【输入列表】对话框中,单击中间的【>】【>>】【<】【<<】按钮,可以在左、右列表中,选中或移除工作表,有关按钮说明如下表所示

按钮说明
>表示右移按钮,选择左边【可用项目】列表中一个工作表,移到右边【你的选择】列表中

<

表示左移按钮,将右边【你的选择】列表中的一个工作表移回到左边【可用项目】列表中,与【>】按钮操作相反
>>表示右移批处理按钮,将左边【可用项目】列表中的所有工作表,移到右边【你的选择】列表中
<<表示左移批处理按钮,将右边【你的选择】列表中的所有工作表,移回到左边【可用项目】列表中,与【>>】按钮操作相反

在【输入列表】对话框中,将左边【可用项目】工作表"Sheet1"选中移到右边【你的选择】表中 

(3) 设置选中的工作表参数

单击【确定】按钮,将【你的选择】列表选中的“Sheet1”工作表添加至【要读取的工作表列表】表中进行参数设置,【起始行】和【起始列】参数都设置为"0",此时完成【工作表】选项卡参数的设置,如下图所示

提示Tips

如果导入的Excel文件中的每个工作表的字段结构都相同,那么在【要读取的工作表列表】表中的第1行,不设置任何工作表名称(即【工作表名称】输入栏留空),只需设置第1行的【起始行】和【起始列】输入栏参数,这样的设置是读取所有的工作表,即第1行将用于所有工作表

【字段】选项卡参数

单击【字段】选项卡,如下图所示

在【字段】选项卡中,设置"物理成绩.xls"文件中字段的参数,步骤如下所示

(1) 获取字段

单击【获取头部数据的字段…】按钮,添加字段到【字段】表中设置字段参数,如下图所示

(2) 设置字段参数

对字段参数进行设置,如下图所示,此时完成【字段】选项卡参数的设置

当获取字段后,【Excel输入】对话框下方【预览记录】按键的字体显示为黑色,说明此时可以预览数据

提示Tips

需要说明的是,如果有些Excel文件的文件头部没有字段数据,那么系统会自动生成默认的字段名称,也可以重新编辑字段名称,字段的类型、长度等字段属性

【内容】选项卡参数

单击【内容】选项卡,如下图所示

对读取Excel文件内容进行参数设置,一般按照缺省值配置,参数的说明如下表所示

参数名称说明
头部表示对选中的工作表是否包含表头行。默认值为√
非空记录表示是否在输出中不出现空行(记录)。默认值为√
停在空记录表示当读取记录遇到空行时,选择是否停止读取文件的当前工作表。默认值为空
限制表示限制生成的记录数量。当设置为0时,结果不受限制。默认值为0
编码表示读入的文本文件编码。第一次使用时,Kettle会在系统中搜索可用的编码。使用Unicode的,请指定UTF-8或UTF-16。默认值为Kettle系统的编码

【错误处理】选项卡参数 

单击【错误处理】选项卡,如下图所示,可对获取Excel文件时产生的错误处理参数进行设置,检查和定位错误位置,一般按照缺省值配置

【其他输出字段】选项卡参数

单击【其他输出字段】选项卡,如下图所示

对Excel文件的其他输出字段参数进行设置,用于指定处理文件的附加信息,默认值为空,一般按照缺省值配置,有关参数的说明如下表所示

字段参数说明
文件名称字段表示指定完整的文件名称和扩展名的字段。默认值为空
工作表名称字段表示指定要使用的工作表名称的字段。默认值为空
表单的行号列表示指定要使用的当前工作表行号字段。默认值为空
行号列表示指定写入行数的字段。默认值为空
文件名字段表示指定文件名但没有路径信息、但有扩展名的字段。默认值为空
扩展字段表示指定文件名扩展名的字段。默认值为空
路径字段表示指定以操作系统格式包含路径的字段。默认值为空
文件大小字段表示指定文件数据大小的字段。默认值为空
是否为文件隐藏字段表示文件是否为隐藏的字段(布尔值)。默认值为空
Uri字段表示指定包含Uri的字段。默认值为空
Root Uri字段表示指定仅包含uri的根部分的字段。默认值为空

3. 预览结果数据

设置好字段参数后,单击【预览记录】按钮,弹出【预览数据数量】对话框,要预览的行数采用默认值,并单击【确定】按钮

弹出【预览数据】对话框,展示Excel输入的数据,如下图所示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/134339.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI智能公文写作助手“文山会海“

公文写作痛点 没思路&#xff0c;公文写作无从下手公文类型繁多&#xff0c;一时难以全面掌握公文内容组织难度大&#xff0c;不易清晰、有逻辑的进行表达时间紧任务急&#xff0c;往往需要在有限的时间内完成大量写作工作反复修改优化&#xff0c;需满足更多新要求&#xff0…

Linux学习之vim跳转到特定行数

参考的博客&#xff1a;《Vim跳到最后一行的方法》 《oeasy教您玩转vim - 14 - # 行头行尾》 《Linux&#xff1a;vim 中跳到首行和最后一行》 想要跳到特定行的话&#xff0c;可以在命令模式和正常模式进行跳转。要是对于vim的四种模式不太熟的话&#xff0c;可以到博客《Linu…

使用VSCODE链接Anaconda

打代码还是在VSCODE里得劲 所以得想个办法在VSCODE里运行py文件 一开始在插件商店寻找插件 但是没有发现什么有效果的 幸运的是VSCODE支持自己选择Python的解释器 打开VSCODE 按住CtrlShiftP 输入Select Interpreter 如果电脑已经安装上了Python的环境 VSCODE会默认选择普通…

Redis中的渐进式遍历-Scan命令

之前我们学习过遍历命令keys,而keys *是一次性的把整个redis中所有的key都获取到.在不知道当前redis中有多少key的情况下,这个操作是非常危险的,可能会一下子得到太多的key而阻塞redis服务器.从而使其他redis客户端卡顿. 通过渐进式遍历,就可以做到,既可以获取到所有的key,同时…

视频集中存储EasyCVR平台播放一段时间后出现黑屏是什么原因?该如何解决?

安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快&#xff0c;可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等&#xff0c;以及支持厂家私有协议与SDK接入&#xff0c;包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安…

零代码编程:用ChatGPT批量提取flash动画swf文件中的mp3

文件夹&#xff1a;C:\迅雷下载\有声绘本_flash[淘宝-珍奥下载]\有声绘本 flash&#xff0c;里面有多个flash文件&#xff0c;怎么转换成mp3文件呢? 可以使用swfextract工具从Flash动画中提取音频&#xff0c;下载地址是http://www.swftools.org/download.html&#xff0c;也…

Python学习-shutil模块和OS模块学习

shutil模块 针对文件的拷贝&#xff0c;删除&#xff0c;移动&#xff0c;压缩和解压操作 # 1.copyfileobj只能复制文件内容&#xff0c;无法复制权限#复制文件时&#xff0c;要选择自己有权限的目录执行操作&#xff0c;创建的文件会根据系统umask设定的参数来指定用户权限 s…

理解交叉熵(Cross Entropy)

交叉熵&#xff08;Cross-Entropy&#xff09;是一种用于衡量两个概率分布之间的距离或相似性的度量方法。在机器学习中&#xff0c;交叉熵通常用于损失函数&#xff0c;用于评估模型的预测结果与实际标签之间的差异。 在分类问题中&#xff0c;交叉熵损失函数通常用于多分类问…

项目构建工具maven的基本配置+idea 中配置 maven

&#x1f451; 博主简介&#xff1a;知名开发工程师 &#x1f463; 出没地点&#xff1a;北京 &#x1f48a; 2023年目标&#xff1a;成为一个大佬 ——————————————————————————————————————————— 版权声明&#xff1a;本文为原创文…

数据结构与算法—双链表

前言 前面有很详细的讲过线性表(顺序表和链表)&#xff0c;当时讲的链表以单链表为主&#xff0c;但在实际应用中双链表有很多应用场景&#xff0c;例如大家熟知的LinkedList。 双链表与单链表区别 单链表和双链表都是线性表的链式实现&#xff0c;它们的主要区别在于节点结构…

一文掌握 Apache SkyWalking

Apache SkyWalking SkyWalking是一个开源可观测平台&#xff0c;用于收集、分析、聚合和可视化来自服务和云原生基础设施的数据。SkyWalking 提供了一种简单的方法来保持分布式系统的清晰视图&#xff0c;甚至跨云。它是一种现代APM&#xff0c;专为云原生、基于容器的分布式系…

【图像分类】【深度学习】【Pytorch版本】AlexNet模型算法详解

【图像分类】【深度学习】【Pytorch版本】AlexNet模型算法详解 文章目录 【图像分类】【深度学习】【Pytorch版本】AlexNet模型算法详解前言AlexNet讲解卷积层的作用卷积过程特征图的大小计算公式Dropout的作用AlexNet模型结构 AlexNet Pytorch代码完整代码总结 前言 AlexNet是…

【网络协议】

网络协议 1 网络通讯1.1 防火墙1.2 子网掩码1.3 网关1.4 2 SSH2.1 SSH2.2 SSH12.3 SSH2 3 Telnet4 Telnet/SSL5 NFS6 TFTP7 FTP8 SFTP9 HTTP10 HTTPS11 NAT12 加密 1 网络通讯 1.1 防火墙 所谓“防火墙”&#xff0c;是指一种将内部网和公众访问网(如Internet)分开的方法&…

技术分享 | app自动化测试(Android)-- 属性获取与断言

断言是 UI 自动化测试的三要素之一&#xff0c;是 UI 自动化不可或缺的部分。在使用定位器定位到元素后&#xff0c;通过脚本进行业务操作的交互&#xff0c;想要验证交互过程中的正确性就需要用到断言。 常规的UI自动化断言 分析正确的输出结果&#xff0c;常规的断言一般包…

蓝桥杯练习

即约分数 题目 思路 遍历所有的x&#xff0c;y&#xff0c;判断x/y是不是即越约分数。 代码 #include <iostream> using namespace std; int gcd(int x,int y) {int r;while(y!0){rx%y;xy;yr;}return x; } int main() {// 请在此输入您的代码int sum4039;//1/y和x/1都…

前端食堂技术周刊第 103 期:10 月登陆 Web 平台的新功能、TS 5.3 RC、React 2023 状态、高并发的哲学原理、Web 资源加载优先级

美味值&#xff1a;&#x1f31f;&#x1f31f;&#x1f31f;&#x1f31f;&#x1f31f; 口味&#xff1a;夏梦玫珑 食堂技术周刊仓库地址&#xff1a;https://github.com/Geekhyt/weekly 大家好&#xff0c;我是童欧巴。欢迎来到前端食堂技术周刊&#xff0c;我们先来看下…

深入详解高性能消息队列中间件 RabbitMQ

目录 1、引言 2、什么是 RabbitMQ &#xff1f; 3、RabbitMQ 优势 4、RabbitMQ 整体架构剖析 4.1、发送消息流程 4.2、消费消息流程 5、RabbitMQ 应用 5.1、广播 5.2、RPC VC常用功能开发汇总&#xff08;专栏文章列表&#xff0c;欢迎订阅&#xff0c;持续更新...&am…

Danswer 接入 Llama 2 模型 | 免费在 Google Colab 上托管 Llama 2 API

一、前言 前面在介绍本地部署免费开源的知识库方案时&#xff0c;已经简单介绍过 Danswer《Danswer 快速指南&#xff1a;不到15分钟打造您的企业级开源知识问答系统》&#xff0c;它支持即插即用不同的 LLM 模型&#xff0c;可以很方便的将本地知识文档通过不同的连接器接入到…

webgoat-Sensitive Data Exposure 敏感信息泄露

insecure login不安全的登录 Encryption is a very important tool for secure communication 0x02 点击login&#xff0c;可以看到payload里的username和password&#xff0c;输入后点击submit即可。 这题的目的是说明&#xff0c;信息传输过程中需要加密&#xff0c;如不…

论文阅读——What Can Human Sketches Do for Object Detection?(cvpr2023)

论文&#xff1a;https://openaccess.thecvf.com/content/CVPR2023/papers/Chowdhury_What_Can_Human_Sketches_Do_for_Object_Detection_CVPR_2023_paper.pdf 代码&#xff1a;What Can Human Sketches Do for Object Detection? (pinakinathc.me) 一、 Baseline SBIR Fram…