MATLAB实现随机森林回归算法

随机森林回归是一种基于集成学习的机器学习算法,它通过组合多个决策树来进行回归任务。随机森林的基本思想是通过构建多个决策树,并将它们的预测结果进行平均或投票来提高模型的准确性和鲁棒性。

以下是随机森林回归的主要特点和步骤:

  1. 决策树的构建: 随机森林由多个决策树组成。每个决策树都是通过对原始数据进行有放回的随机抽样(bootstrap抽样)来训练的。此外,在每次分裂节点时,算法随机选择一个特征子集进行分裂,以增加模型的多样性。

  2. 预测过程: 对于回归任务,随机森林中的每个决策树都会输出一个预测值。最终的随机森林预测结果是这些预测值的平均值。

  3. 超参数调优: 随机森林有一些重要的超参数,如树的数量、每棵树的最大深度、特征子集的大小等。通过交叉验证等方法,可以调整这些超参数以优化模型性能。

  4. 特征重要性: 随机森林可以提供每个特征对于模型预测的重要性程度。这对于理解模型和特征选择非常有帮助。

  5. 抗过拟合: 随机森林具有较好的抗过拟合能力,因为每个决策树都是在不同的数据子集上训练的,且通过随机选择特征子集来减少相关性。

    In=ques2c(:,2:7);
    Out=ques2c(:,1);;
    %此处未进行归一化,切记,使用归一化的数据进行训练,后面要记得反归一化,且数据多处进行归一化,不可遗漏
    nTree = 100;%树的个数
    %训练模型
    Factor = TreeBagger(nTree, In, Out,'Method','regression','OOBpredictorImportance','on','MinLeafSize',5);%
    %性能评估,k-fold交叉验证法
    subplot(121)
    [Predict_label,Scores] = predict(Factor, In);
    plot(Out,Out,'LineWidth',3);
    hold on
    scatter(Out,Predict_label,'filled');
    xlabel('Real temp')
    ylabel('Predict temp')
    hold off
    grid on
    subplot(122)
    plot(Factor.oobError,'LineWidth',2);
    xlabel('Number of grown trees')
    ylabel('Out-of-bag classification error')
    grid on
    %%
    view(Factor.Trees{1},'Mode','graph')
    %变量重要性直方图
    weights=Factor.OOBPermutedVarDeltaError;
    %重要性降序barh(weights)
    set(gca,'yticklabels',{'CO? emission','NOx emission','SO? emission','VOCs emission','CO? concentration','Population'})
    xlabel('Weights')
    ylabel('Index')
    %误差变化图
    figure
    plot(Factor.oobError,'LineWidth',2);
    xlabel('生长树数量','FontSize',30)
    ylabel('袋外错误率','FontSize',30)
    title('袋外错误率','FontSize',30)
    set(gca,'FontSize',16)
    set(gca,'LineWidth',2);   
    grid on
    % 计算R方值
    SSR = sum((Predict_label - mean(y_test)).^2);
    SST = sum((y_test - mean(y_test)).^2);
    R_squared = 1 - SSR/SST;
    % 打印R方值
    disp(['R方值为: ', num2str(R_squared)]);
    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/676920.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

“SharpDocx” C#项目中用于创建 Word 文档的轻量级模板引擎

简介: SharpDocx是一个轻量级的模板引擎,用于创建Word文档。它允许开发者基于视图生成Word文档,这个视图本身就是一个Word文档,可以根据需要设置简单或复杂的布局。 以下是一些主要特点: 模板引擎类似Razor&#xf…

jmeter-问题二:JMeter进行文件上传时,常用的几种MIME类型

以下是一些常用的MIME类型及其对应的文件扩展名: 文本类型: text/plain: 通常用于纯文本文件,如 .txt 文件。 text/html: 用于HTML文档,即 .html 文件。 application/msword: Microsoft Word文档,即 .doc 和 .docx 文件。 图像…

【大厂AI课学习笔记】【1.5 AI技术领域】(8)文本分类

8,9,10,将分别讨论自然语言处理领域的3个重要场景。 自然语言处理,Natual Language Processing,NLP,包括自然语言识别和自然语言生成。 用途是从非结构化的文本数据中,发掘洞见,并访问这些信息&#xff0…

哈工大团队顶刊发布!由单偏心电机驱动的爬行机器人实现多方向运动传递

单电机也能驱动平面内前进和转弯运动?没错,图中的机器人名叫GASR,仅由四个零件组成,分别是偏心电机、电池、电路板、聚酰亚胺薄片,它可以灵活自如地实现前进、转弯等移动。其中的核心驱动器——纽扣式偏心转子电机产自…

[SAP] ABAP设置非系统关键字代码提示功能

在事务码SE38(ABAP编辑器)屏幕右下角,点击【Options选项】图标 勾选【代码完成】|【建议文本中的非关键字】,并点击【保存】按钮 在下面的程序代码中,当我需要输入在11行的位置输入非关键字lv_str的时候,会有非关键字代码提示的功…

django中实现数据迁移

在Django中,数据迁移(data migrations)通常指的是将模型(models)中的数据从一个状态迁移到另一个状态。这可以涉及很多操作,比如添加新字段、删除字段、更新字段的数据类型,或者更改表之间的关系…

【java】Hibernate访问数据库

一、Hibernate访问数据库案例 Hibernate 是一个在 Java 社区广泛使用的对象关系映射(ORM)工具。它简化了 Java 应用程序中数据库操作的复杂性,并提供了一个框架,用于将对象模型数据映射到传统的关系型数据库。下面是一个简单的使…

JAVA设计模式之模版方法模式详解

模板方法模式 1 模板方法模式介绍 模板方法模式(template method pattern)原始定义是:在操作中定义算法的框架,将一些步骤推迟到子类中。模板方法让子类在不改变算法结构的情况下重新定义算法的某些步骤。 模板方法中的算法可以理解为广义上的业务逻辑…

【canvas】实现画布橡皮擦功能、并解决擦除不连贯问题;

简单介绍橡皮擦功能思路,代码demo自己看看就好了,一点都不复杂: 确认橡皮擦大小,可动态设置;鼠标按下记录点击的坐标,然后根据设置的橡皮擦大小画一个圆,最后清除该圆形区域坐标范围的颜色信息…

机器学习---概率图模型(概率计算问题)

1. 直接计算法 给定模型和观测序列,计算观测序列O出现的概率。最直接 的方法是按概率公式直接计算.通过列举所有可能的长度为T的状态序列,求各个状 态序列 I 与观测序列的联合概率,然后对所有可能的状态序列求和,得 到。 状态…

洛谷 P2678 [NOIP2015 提高组] 跳石头 (Java)

洛谷 P2678 [NOIP2015 提高组] 跳石头 (Java) 传送门:P2678 [NOIP2015 提高组] 跳石头 题目: [NOIP2015 提高组] 跳石头 题目背景 NOIP2015 Day2T1 题目描述 一年一度的“跳石头”比赛又要开始了! 这项比赛将在一条笔直的河道中进行&…

3 scala集合-Set

与 Java 的 Set 一样,scala 的 set 中,元素都是唯一的,而且遍历 set 中集合的顺序,跟元素插入的顺序是不一样的。 同样,Set 也包含可变和不可变两种。要实现可变 Set 集合,需要使用类 scala.collection.mu…

Centos 性能调优

调优 : 文件使用限制和进程数 查询单个用户对文件描述符的使用限制, 即打开文件的个数 ulimit -n默认是 1024 查询单个用户最多拥有的进程数 ulimit -u默认是 4096 调整两个参数为 65535 (2^16 - 1) 修改 sudo vi /etc/security/limits.conf * soft nof…

在屏蔽任何FRP环境下从零开始搭建安全的FRP内网穿透服务

背景 本人目前在境外某大学读博,校园网屏蔽了所有内网穿透的工具的数据包和IP访问,为了实现在家也能远程访问服务器,就不得不先开个学校VPN,再登陆。我们实验室还需要访问另一个大学的服务器,每次我都要去找另一个大学…

Mysql-Explain-使用说明

Explain 说明 explain SELECT * FROM tb_category_report;id:SELECT识别符,这是SELECT查询序列号。select_type:表示单位查询的查询类型,比如:普通查询、联合查询(union、union all)、子查询等复杂查询。table&#x…

酷开科技荣获消费者服务平台黑猫投诉“消费者服务之星”称号

什么是优质服务?既是以客户为中心的庄严承诺,又是对服务能力提升的深耕细作;既是对服务标准的敬畏,也是对服务创新的不断探索……服务是多维的,每个企业都有自己独到的诠释,或事无巨细环环严控,…

NumPy:Python的强大数值计算库

NumPy:Python的强大数值计算库 NumPy(Numerical Python)是Python中最常用和最强大的数值计算库之一。它提供了高性能的多维数组对象和广泛的数学函数,使得在Python中进行科学计算和数据分析变得更加简单和高效。本文将介绍NumPy的…

《动手学深度学习(PyTorch版)》笔记8.1

注:书中对代码的讲解并不详细,本文对很多细节做了详细注释。另外,书上的源代码是在Jupyter Notebook上运行的,较为分散,本文将代码集中起来,并加以完善,全部用vscode在python 3.9.18下测试通过&…

kmeans聚类选择最优K值python实现

Kmeans算法中K值的确定是很重要的。 下面利用python中sklearn模块进行数据聚类的K值选择 数据集自制数据集,格式如下: 维度为3。 ①手肘法 手肘法的核心指标是SSE(sum of the squared errors,误差平方和), 其中,Ci是第…

【玩转408数据结构】线性表——定义和基本操作

考点剖析 线性表是算法题命题的重点,该类题目实现相对容易且代码量不高,但需要最优的性能(也就是其时间复杂度以及空间复杂度最优),这样才可以获得满分。所以在考研复习中,我们需要掌握线性表的基本操作&am…