文章目录
- 1.构造数据
- 2.缺失值的处理
- 3.异常值的处理
- 4.导入数据的注意事项
- 5.插值拟合工具箱使用
1.构造数据
下面的这个就是生成这个正态分布的数据,这个时候我们的这个数据里面是没有这个异常的数据的,因此这个时候我们可以自己创造这个异常的数据:
下面的这个代码里面的这个NaN表示的就是缺失值,然后构造出来了四个异常值,绘制这个函数图像;
x=1:100;
data=randn(1,100);
data(20:20:80)=NaN;
data(10)=-50;
data(40)=45;
data(70)=-40;
data(90)=50;
plot(x,data)
2.缺失值的处理
我们可以让这个显示出来这个控件和代码,使用这个线性插值的方法对于这个缺失的数据进行填充;
下面的这个就是进行这个缺失值处理之后的这个结果:
3.异常值的处理
在我们的这个matlab里面称这个异常值为离群数据,两个说法都是一样的:
这个地方我们的这个异常值的处理是基于上面的这个缺失值处理之后的这个结果的基础上面再次进行这个异常值的处理:
因此我们进行这个选择的时候,输入的这个数据需要是这个上面的操作之后的数据集合,而不是我们最开始的这个数据集合data;使用这个线性插值的方法对于这个异常数据进行处理;
我们可以看到这个离群数据进行处理的时候,是在这个异常数据这个点的位置打上叉号,然后使用这个插值数据进行填充:
4.导入数据的注意事项
我们的这个到处类型如果是表的话,这个就是一个类似于矩阵的东西;
导出的是列向量,这个时候就是单独的一列数据,我们可以单独进行这个向量的定义;
我们再进行这个数据的导出的时候可以生成这个对应的脚本,把这个脚本存放在我们当前的这个工作区里面去,这样话,我们的这个数据进行修改的时候,就可以直接执行这个脚本的名字作为这个指令,对于这个数据进行更新,减少一些不必要的操作;
5.插值拟合工具箱使用
找到这个拟合的工具箱:
选择我们的这个工作区里面需要进行这个拟合的数据:
这个右上角我们可以选择这个多项式的这个次数,右下角会显示这个多项式的这个拟合的结果,以及这个置信区间,拟合优度(对于这个你和结果的评价,就是这个结果是好还是不好)的介绍
插值的话也是在这个页面进行操作的:
同理我们可以在这个右上角选择这个不同的插值的类型: