公式
为您的数据集添加新特征。
输入
数据:输入数据集
输出
数据:带有额外特征的数据集
公式组件允许通过使用用户定义的表达式来计算新列。结果列可以是分类的、数值的或文本的。
对于数值变量,只需提供名称和表达式。
1.构建变量列表
2.添加或删除变量
3.新特征名称
4.Python表达式
5.选择一个特征
6.选择一个函数
7.生成报告
8.点击发送以传达更改
以下示例显示了如何构建一个分类变量:
如果“sepal length”(萼片长度)小于6,其值为“lower”,至少为6但小于7时为“mid”,否则为“higher”。
注意需要将空格替换为下划线(sepal_length)。
1.变量定义列表
2.添加或删除变量
3.新特征名称
4.Python表达式
5.如果勾选,该特征将被置于元属性中
6.在表达式中选择一个特征
7.在表达式中选择一个函数
8.可选的值列表,用于定义它们的顺序
9.点击发送以计算并输出数据
提示
如果您不熟悉Python数学语言,这里有一个快速入门。
表达式可以使用以下运算符:
+, -, *, /:加法、减法、乘法、除法
//:整数除法
%:整数除法后的余数
**:指数运算(例如,平方根的平方可通过0.5)
<, >, <=, >=:小于、大于、小于等于、大于等于
==:等于
!=:不等于
if-else:如果条件成立则取值,否则取其他值(见上述示例)
“Values (optional)”选项:如果您提供了这个值列表,那么您在上方定义的表达式必须返回一个从0开始的整数索引,这个索引对应于值列表中的位置。换句话说,表达式的输出应该是一个整数,它指示实例应该被分类到哪个预定义的类别中。
列名 表达式
年轻5岁:年龄-5
年龄段: "非老年" if 年龄 <=60 else "老年"
0 if 年龄 <=60 else 1 Values (optional)”选项:非老年,老年,儿童,中年
年龄描述:str(姓名)+"的年龄是:"+str(int(年龄))+"岁"
说明列长度:len(说明)
在Orange3的Formula组件中,以下是您提到的函数及其功能的详细说明:
abs: 返回数值的绝对值。
acos: 返回数值的反余弦值(以弧度为单位)。
acosh: 返回数值的反双曲余弦值(以弧度为单位)。
asin: 返回数值的反正弦值(以弧度为单位)。
asinh: 返回数值的反双曲正弦值(以弧度为单位)。
atan: 返回数值的反正切值(以弧度为单位)。
atan2: 返回两点间的反正切值(考虑了两点的坐标)。
atanh: 返回数值的反双曲正切值(以弧度为单位)。
ceil: 返回大于或等于给定数值的最小整数。
comb: 计算组合数,即从n个不同元素中取出k个元素的组合数。
copysign: 返回与第一个参数数值相同,但符号与第二个参数相同的数值。
cos: 返回数值的余弦值(以弧度为单位)。
cosh: 返回数值的双曲余弦值。
degrees: 将弧度转换为度数。
dist: 计算两个点之间的欧几里得距离。
e: 自然对数的底数(约等于2.71828)。
erf: 计算误差函数值。
erfc: 计算互补误差函数值。
exp: 返回数值的指数。
expm1: 返回数值的指数减1。
fabs: 返回数值的绝对值。
factorial: 计算给定非负整数的阶乘。
float: 将数值转换为浮点数。
floor: 返回小于或等于给定数值的最大整数。
fmod: 返回两个数值的模(余数)。
frexp: 分解浮点数为尾数和指数。
fsum: 计算数值序列的和。
gamma: 计算伽玛函数值。
gcd: 计算最大公约数。
hypot: 计算直角三角形的斜边长度(即勾股定理)。
inf: 表示无穷大。
int: 将数值转换为整数。
isclose: 检查两个数值是否足够接近。
isfinite: 检查数值是否是有限的。
isinf: 检查数值是否是无穷大。
isnan: 检查数值是否是NaN(不是一个数字)。
isqrt: 计算数值的整数平方根。
lcm: 计算最小公倍数。
ldexp: 将浮点数的尾数乘以2的指数次幂。
len: 返回序列的长度。
lgamma: 计算对数伽玛函数值。
log: 返回数值的自然对数。
log10: 返回数值的以10为底的对数。
log1p: 返回1加数值的自然对数。
log2: 返回数值的以2为底的对数。
max: 返回数值序列中的最大值。
min: 返回数值序列中的最小值。
modf: 分解浮点数为整数部分和分数部分。
nan: 表示NaN(不是一个数字)。
nextafter: 返回紧接在给定数值之后的下一个数值。
perm: 计算排列数,即从n个不同元素中取出k个元素的排列数。
pi: 圆周率(约等于3.14159)。
pow: 返回第一个数值的第二个数值次幂。
prod: 计算数值序列的乘积。
radians: 将度数转换为弧度。
remainder: 返回两个数值的余数。
sin: 返回数值的正弦值(以弧度为单位)。
sinh: 返回数值的双曲正弦值。
sqrt: 返回数值的平方根。
str: 将数值转换为字符串。
tan: 返回数值的正切值(以弧度为单位)。
tanh: 返回数值的双曲正切值。
tau: 表示两倍的圆周率(约等于6.28318)。
trunc: 截断浮点数,去除小数部分,返回整数部分。
ulp: 返回两个浮点数之间的最小单位(单位在最后的位置)。
这些函数在数据分析和处理中非常有用,可以帮助用户进行复杂的数学运算,从而在Orange3中进行更高级的数据操作。
视频教程:关注我不迷路, 抖音:Orange3dev
https://www.douyin.com/user/MS4wLjABAAAAicBGZTE2kX2EVHJPe8Ugk3_nlJk9Nha8OZh4Bo_nTu8
1-Orange3安装
2-Orange3汉化DIY
3-Orange3创建快方式
4-数据导入(文件&数据表格组件)
5-数据导入(Python组件)
6-Python库安装(SQL表组件)
7-数据导入(Mysql)
8-数据导入(数据绘画和公式组件)
9-数据修改(域编辑和保存组件)
10-数据可视化(调色板&数据信息组件)
11-数据可视化(特征统计组件)
12-数据预处理(行选择组件)
13-特征选择(Rank组件)
14-数据转换(数据采样组件)
15-数据预处理(列选择组件)
16-数据预处理(转置组件)
17-数据预处理(合并数据组件)
18-数据预处理(连接组件)无主表且列数不同
19-数据预处理(连接组件)主附表
20-数据预处理(索引选择器组件)
21-数据预处理(唯一组件)
22-数据预处理(列聚合组件)
23-数据预处理(分组组件)
24-数据预处理(透视图表组件)
25-数据预处理(转换器组件)-表格互为模板
26-数据预处理(转换器组件)-转换示例
27-数据预处理(预处理器组件)-基本信息
28-数据预处理(预处理器组件)-特征选择
29-数据预处理(预处理器组件)-填充缺失值并标准化特征
30-数据预处理(预处理器组件)-离散化连续变量
31-数据预处理(预处理器组件)-连续化离散变量
32-数据预处理(预处理器组件)-主成分分析PCA与CUR分解
33-数据预处理(缺失值处理组件)
34-数据预处理(连续化组件)
35-数据预处理(离散化组件)
36-数据预处理(随机化组件)
37-数据预处理(清理特征组件)-清理未使用特征值及常量特征
38-数据预处理(宽转窄组件)
39-数据预处理(公式组件)
40-数据预处理(分类器组件)
41-数据预处理(创建实例)
42-数据预处理(Python代码组件)